rato próf 2 Flashcards
þýði
allur hópurinn sem við viljum rannsaka eða fá upplýsingar um.
t.d allir íbúar á íslandi eða allir nemendur í HR
úrtak
það er hluti hóps úr þýðinu sem er valin til að framkvæma rannsóknina.
úrtakið er notað til að draga ályktanir um þýði í heild.
munur á þýði og úrtaki
þýði er heildin en úrtakið er hluti af þýðinu
slembival
aðferð við að velja úrtak þýði þar sem allir meðlimir þýðisins hafa jafna möguleika að vera valdnir
þetta tryggir að úrtakið sé óhlutdrægt og að það endurspegli þýðið best.
það er líka mikilvægt til að draga ályktanir um þýði með minni skekkju og auknum trúverðuleika.
hjálpar til að forðast skekkju í valinu.
stika þýðisn
stærðir eins og staðalfrávik og meðaltöl kallast stikar í þýði en lýsistærðir í úrtaki
stika þýðis er óþekkt, t.d hver er raunverulegur fjöldi einstaklinga sem er haldinn alvarlegu þunglyndi.
notum lýsistærðir fengnar með því að skoða úrtak einstaklinga til þess að áætla óþekkta stika þýðis
tvær leiðir til þess að áætla um þýði
- stærðfræðileg aðferð- byggir á ströngum forsendum um dreifingu og nýtir sér kenningar úr líkindafræði
- taka endurtekin úrtök sem eru síðan notuð til þess að álýkta um þýðið
stærðfræðileg aðferð
stærðfræðileg aðferð sem byggir á ströngum forsendum um drefiningu og nýtir kenningar úr líkindafræði
- tölfræðikenningar byggja sem á líkindafræði
- til að skilja kenningar á bak við tölfræði,, þarf að skilja grunnhugtök í líkindafræði
- þessar aðferðir eru klassisk tölfræði
- líkindadreifing er notuð til að meta óvissu niðurstaðna
aðferð sem notar endurtekin úrtök til þess að áætla um þýði
Nútíma tölfræðiaðferðir, byggja á gömlum kenningargrunni, sem nota hermanir til þess að álykta um þýðið.
Hermt/líkt eftir raunveruleikanum með því að nota endurteknar tilraunir sem gerðar eru í tölvu.
Í stað þess að gera ráð fyrir að þýði hafi ákveðna dreifingu, notum við úrtakadreifingu til þess að “endurskapa þýðið”.
Úrtakadreifing er fengin með því að taka endurtekin úrtök.
Úrtakadreifing er notuð til þess að meta óvissu niðurstaðna
um stærð úrtaks og lögun dreifinga
almenna reglan er su að stærri úrtök gefa betra mat á þýðinu
þetta á við
Þetta á við út af markgildissetningunni
markgildissetngin
Við það að fjöldi í úrtaki stækkar þá mun dreifing nálgast dreifingin normaldreifingu.
Dreifingin nálgast normaldreifingu óháð því hvort að dreifingin í þýði sé normaldreifð
líkindafræði
það er undirgrein stærðfræðinnar sem fjallar um líkindi
líkindi er tala á bilinu 0-1 sem segir til um hversu líklegur atburðurinn gerist
- 0 gerist aldrei
- 0,5 gerist helming skipta
- 1 þá gerist alltaf
líkindi eru oft táknuð: P þar sem P stendur fyrir líkur og A táknar atburði
Líkur á því að fá skjaldamerki eru 0.5 eða 50:50 líkur, má tákna P(skjaldamerki)=0.5
Líkur á að fá fimm eða hærra á sexhliða teningi eru 1/3 eða um 33% líkur, má tákna P(sexhliða teningur≥5)=26=13
hvernig reiknum við líkur
líkur eru fundnar með því að finna hlutfall jákvæðra atburða í fjölda mögulega atburða
atburður
það er mengi af útkomunni úr líkindatilraun
t.d
Skjaldarmerki” og “Fiskur” í peninga kasti
“fá ás”, “fá tvist”,…,“fá sexu” í teninga kasti
“fjöldi réttra svara” á minnisprófi
“fjöldi stiga” á kvíðalista
úrtaksrúm
táknað með S er mengi af öllum mögulegum útkomum úr líkindatilraun
t.d
Peningur S = {Skjaldarmerki, Fiskur}
Sexhliða teningur S = {1,2,3,4,5,6}
20 atriða minnispróf S = {0,1,2,…,19,20}
10 atriða kvíðalisti S = {0,1,2,…,9,10}
Dæmi um líkindatilraun
Með því að endurtaka líkindatilraunir (t.d. kasta pening aftur og aftur) þá verður hlutfallið af útkomum þar sem atburður gerist (t.d. fá skjaldarmerki) að réttum líkum (hér 0,5 þ.e. P(skjaldamerki) = 0,5).
regla um andstæða atburði
Líkurnar á því að atburður gerist EKKI er einn mínus líkur á að atburður gerist P(¬A)=1−P(A)
Ef líkur á því að atburður gerist eru 0,70 þá eru líkur á því að atburður gerist ekki 0,30 (1 - 0,70 = 0,30)
Ef það eru 60% líkur á því að atburður gerist, þá eru 40% líkur á því að atburður gerist ekki (100% - 60% = 40%)
summureglan
Summureglan (addition rule) líka kölluð “eða reglan” (OR rule).
Líkurnar á því að tveir ósamrýmanlegir atburðir (mutely exclusive events) gerist er summa atburðanna.
P(A eða B)=P(A)+P(B)
ef A og B geta ekki gerst á sama tíma.
Dæmi:
Ef nemendur í háskóla geta aðeins verið skráðir í eina deild og það eru 20% nemenda í sálfræði og 10% nemenda í hjúkrunarfræði þá er P(sálfræði) = 10% og P(hjúkrunarfræði) = 20%
Þar sem nemandi getur einungis verið skráður í eina deild þá er hlægt að nota samlagningarregluna til þess að finna líkurnar á því að vera í sálfræði eða hjúkrunarfræði P(sálfræði) + P(hjúkrunarfræði) = 20% + 10% = 30%.
margföldunarreegla
Líkur á því að tveir óháðir atburðir (independent events) gerist er margfeldi atburðanna.
P(A og B)=P(A)P(B)
, þ.e. þegar útkoma A hefur engin áhrif á útkomu B eða öfugt.
Dæmi:
Ef við hendum sexhliða tening, hverjar eru líkurnar á því að fá sexu þrisvar sinnum í röð?
Líkur á því að fá eina sexu á teningi eru P(fá sex) = 16
Þar sem hvert teningakast eru óháðir atburðir þá getum við notað margföldunarregluna til þess að finna líkurnar á því að fá sexu þrisvar sinnum í röð P(fá sex)P(fá sex)P(fá sex) = 16∗16∗16=1216=0,005
eða (16)3=1216=0,005
líkindafræði
líkanið af heiminum er þekkt, notum líkanið til þess að reikna út líkur á því að atburður gerist
líkindalíkið er þekkt en gögnin eru óþekkt
tölfræði
líkanið af heiminum er óþekkt, notum gögnin til þess að finna tölfræðilíkanið
tölfræðilíkanið er óþekkt en gögnin eru þekkt
Líkindi byggð á tíðni
Líkindi eru fundin með endurteknum líkindatilaunum (probability experiment).
Með því að endurtaka líkindatilraun óendanlega oft fást líkur á því að atburður gerist
Líkindi byggð á kenningu Bayes
Huglægt mat (subjective) á líkum.
Líkindi eru skilgreind út frá trú okkar á því (degree of belief) að atburður gerist.
Líkindi byggja á fyrri reynslu, uppfærum líkurnar með nýjum gögnum.
Líkindi eru ekki eitthvað sem fyrirfinnst í veruleikanum heldur er stærð sem hugsandi vera (rational agent) gefur atburðinum.
slembistærð/slembibreyta
Gerum ráð fyrir að breyta X
sem við höfum áhuga á megi lýsa með slembistærð / slembibreytu.
Slembibreyta X getur verið einhver breyta sem við höfum áhuga á t.d. þunglyndiseinkenni í þýði Íslendinga eða aldur nemenda í þýði sálfræðinema
Slembibreytur/slembistærðir eru stærðir sem við gerum ráð fyrir að hafi ákveðna líkindadreifingu (probability distribution).
Við höfum tæknilega ekki áhuga á gildinu sjálfu heldur dreifingunni sem þær koma úr.
Ef við þekkjum dreifinguna vitum við hvernig eiginleikinn lítur út.
líkindadreifingar
Tvíkosta dreifing (binomial distribution)
Normal dreifing (normal distribution)
Poisson dreifing (Poisson distribution)
χ2
dreifing (χ2
distribution)
F dreifing (F distribution)
Þær hafa ólíka lögun og ólíka eiginleika.
normal dreifing
Þegar breytur eru samfelldar og lögun dreifingarinnar nálgast normaldreifingu getur verið gagnlegt að nota normaldreifingu.
Þurfum tvo stika (parameters) til þess að lýsa normaldreifingu
Meðaltal (mean) μ
Staðalfrávik
Til þess að nota normaldreifingu til þess að finna líkur á því að atburður gerist byrjum við finna staðalstig Z=x−μσ
Notum svo z-skorið til þess að finna líkur á því að atburður gerist, t.d. með því að notum tölvu til þess að reikna þetta út fyrir okkur eða flettum upp í z-töflu.
Bernoulli-tilraun
tveir möguleikar á niðurstöðu: “sigrar” (eða “success”) og “tapar” (eða “failure”). Þetta hugtak er uppgötvað af franska stærðfræðingnum Jacob Bernoulli.
Einkenni Bernoulli-tilraunar:
Tvær niðurstöður: Hver tilraun hefur aðeins tvær mögulegar niðurstöður.
Óháðar tilraunir: Niðurstöður tilraunanna eru óháðar hver annarri.
Fastar líkur: Líkur á “sigrar” og “tapar” eru alltaf þær sömu í hverri tilraun.
Dæmi um Bernoulli-tilraunir eru: að kasta mynt (krónu eða fót), að svara spurningu rétt eða rangt, eða að kanna hvort viðskiptavinur kaupi vöru eða ekki.
Bernoulli-tilraunir liggja til grundvallar ýmsum tölfræðilegum dreifingum, sérstaklega binomískri dreifingu, sem lýsir fjölda “sigra” í ákveðnu fjölda Bernoulli-tilrauna
lýsandi tölfræði
Taka saman gögn sem við þekkjum og lýsa þeim.
T.d með lýsistærðum (statistics) eins og meðaltali og miðgildi
T.d. með kassariti og stöplariti
Lýsistærðir er þekkt tala sem er breytileg á milli úrtaka
ályktunartölfræði
Að læra eitthvað um hið óþekkta með því að skoða gögn.
T.d. draga ályktun um þýði með því að skoða úrtak.
Stiki (parameter) þýðis er föst tala sem er óþekkt.
Lögmál stórra talna
Við það að stækka úrtakið (N⟶∞
) þá stefnir meðaltal úrtaksins á meðaltal þýðis (X¯⟶u).
Markgildissetningin
Við það að stækka úrtakið (N⟶∞
) þá stefnir meðaltal úrtaksins á normaldreifingu.
úrtakadreifing
Lýsistærðir eins og meðaltal og staðalfrávik eru slembistærðir sem eru dregnar úr líkindadreifingu.
Úrtakadreifing lýsistærðar er líkindadreifing hennar.
Meðaltal úrtakadreifingar er:
μx¯=μx
Staðalfrávik úrtakadreifingar / Staðalvilla meðaltals (Standard error of the mean) er:
SEM=σN‾‾√
öryggisbil
Segir okkur hversu viss við getum verið um að þýðistalan (stiki þýðis - population parameter) liggi á þessu bili.
Öryggisbilið segir okkur ekki hversu líklegt er að þýðistalan sé inn í bilinu.
Heldur segir öryggisbilið okkur að ef við endurtökum tilraun óendanlega oft þá segir öryggisbilið til um fjölda öryggisbila sem inniheldur þýðistöluna.
þar sem z
er öryggið sem vísað er í.
Dæmi um algeng öryggisbil
68%CI=X¯±σn√
95%CI=X¯±1.96σn√
99%CI=X¯±2.576σn√
Túlkun á öryggisbilum byggir á skilgreiningu “frequentista” á líkum en ekki “Bayesian nálgun”. Þ.e. líkur eru fundnar með því að endurtaka líkindatilraun óendalega oft.
úrtök, þýði og að draga úrgtök
Með því að nota einfalt tilviljunar úrtak (simple random) eru jafnar líkur fyrir alla í þýðinu að lenda í úrtakinu.
úrtakskekkja
Ef úrtak er ekki valið með slembivali þá er hætta á því að fá skekktar niðurstöður.
Niðurstöður úrtaksins gefa því ranga mynda af þýðinu.
Niðurstöður úrtakanna þriggja gefa til kynna að úrtakið samanstandi einungis af ⚫
En ef þýðið er skoðað sést að það eru 60%⚪ og 40%⚫
tegundir af úrtökum
Erum lang sjaldnast með einföld tilviljunar úrtök.
Dæmi um annars konar úrtaksgerð (sampling design) sem er oft notuð þegar ekki er hægt að gera einfalt tilviljunar úrtak.
Lagskipt úrtak (Stratified sampling)
Snjóboltaúrtak (Snowball sampling)
Hentugleika úrtak (Convenience sampling)
lagaskipt úrtak
Þýðinu er skipt niður í ákveðna hópa (sub population) sem eru kallaðir lög (starta).
Dæmi um lag gæti verið landshluti, kyn, aldur eða ákveðinn hópur með einhver einkenni.
Það geta verið nokkur lög í úrtaki.
Í stað þess að taka einfalt tilviljunar val úr þýðinu í heild sinn þá eru tekin einföld tilviljunarúrtök úr hverju lagi.
Er mjög gagnlegt þegar ákveðið sub population er sjaldgæft.
T.d. ef við værum að gera rannsókn á stelsýki (kleptomaniu) þá er tíðni stelsýki í almennu þýði um 0.3-0.6%
Hér þyrftum við að skipta úrtakinu í tvennt, stelsjúkir og ekki stelsjúkir.
Tækjum úrtak þannig að hlutfallið í báðum hópum verður jafnt, þessi aðferð kallast oversampling.
snjóboltaúrtak
Aðferð sem er notuð þegar erfitt er að ná í ákveðinn hóp eða ákveðinn hópur í þýðinu er falinn.
T.d. þegar það er ekki til einhver listi yfir einstaklinga í þýðinu.
Rannsakandi hefur samband við nokkra í þýðinu sem á að rannsaka. Þátttakendur eru beðnir um að stinga upp á nokkrum öðrum úr hópnum sem gætu viljað taka þátt í rannsókninni.
Nýju þátttakendunum er boðið að taka þátta í tilrauninni. Þessu er haldið áfram þangað til nægur fjöldi þátttakanda er kominn í rannsóknina.
Kostur aðferðarinnar er að það næst í fólk sem hefði verið ólíklegt að ná til.
Ókosturinn er að úrtakið er ekki tilviljunarúrtak og því erfitt að draga tölfræðilegar ályktanir út frá niðurstöðunum.
Hentar ef til vill betur í eigindlegum rannsóknum (qualitative research)
Annar ókostur er að það getur verið ástæða fyrir því að hópurinn sé falinn og því ekki siðferðislega rétt að afhenda upplýsingar um hver tilheyrir hópnum.
Sérstaklega ef þessar rannsóknir eru gerða á samfélagsmiðlum.
hentugleik úrtak
Þátttakendur velja sjálfir hvort þeir séu í úrtaki eða ekki.
Þeir eru því ekki valdir af handahófi úr þýðinu.
Snjóboltaúrtak er tegund af hentugleika úrtaki.
Getur valdið skekkju í úrtaki.
Getur skapað mikinn vanda í túlkun niðurstaðna.