rato próf 2 Flashcards

1
Q

þýði

A

allur hópurinn sem við viljum rannsaka eða fá upplýsingar um.
t.d allir íbúar á íslandi eða allir nemendur í HR

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

úrtak

A

það er hluti hóps úr þýðinu sem er valin til að framkvæma rannsóknina.
úrtakið er notað til að draga ályktanir um þýði í heild.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

munur á þýði og úrtaki

A

þýði er heildin en úrtakið er hluti af þýðinu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

slembival

A

aðferð við að velja úrtak þýði þar sem allir meðlimir þýðisins hafa jafna möguleika að vera valdnir
þetta tryggir að úrtakið sé óhlutdrægt og að það endurspegli þýðið best.
það er líka mikilvægt til að draga ályktanir um þýði með minni skekkju og auknum trúverðuleika.
hjálpar til að forðast skekkju í valinu.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

stika þýðisn

A

stærðir eins og staðalfrávik og meðaltöl kallast stikar í þýði en lýsistærðir í úrtaki
stika þýðis er óþekkt, t.d hver er raunverulegur fjöldi einstaklinga sem er haldinn alvarlegu þunglyndi.
notum lýsistærðir fengnar með því að skoða úrtak einstaklinga til þess að áætla óþekkta stika þýðis

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

tvær leiðir til þess að áætla um þýði

A
  1. stærðfræðileg aðferð- byggir á ströngum forsendum um dreifingu og nýtir sér kenningar úr líkindafræði
  2. taka endurtekin úrtök sem eru síðan notuð til þess að álýkta um þýðið
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

stærðfræðileg aðferð

A

stærðfræðileg aðferð sem byggir á ströngum forsendum um drefiningu og nýtir kenningar úr líkindafræði
- tölfræðikenningar byggja sem á líkindafræði
- til að skilja kenningar á bak við tölfræði,, þarf að skilja grunnhugtök í líkindafræði
- þessar aðferðir eru klassisk tölfræði
- líkindadreifing er notuð til að meta óvissu niðurstaðna

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

aðferð sem notar endurtekin úrtök til þess að áætla um þýði

A

Nútíma tölfræðiaðferðir, byggja á gömlum kenningargrunni, sem nota hermanir til þess að álykta um þýðið.
Hermt/líkt eftir raunveruleikanum með því að nota endurteknar tilraunir sem gerðar eru í tölvu.
Í stað þess að gera ráð fyrir að þýði hafi ákveðna dreifingu, notum við úrtakadreifingu til þess að “endurskapa þýðið”.
Úrtakadreifing er fengin með því að taka endurtekin úrtök.
Úrtakadreifing er notuð til þess að meta óvissu niðurstaðna

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

um stærð úrtaks og lögun dreifinga

A

almenna reglan er su að stærri úrtök gefa betra mat á þýðinu
þetta á við
Þetta á við út af markgildissetningunni

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

markgildissetngin

A

Við það að fjöldi í úrtaki stækkar þá mun dreifing nálgast dreifingin normaldreifingu.
Dreifingin nálgast normaldreifingu óháð því hvort að dreifingin í þýði sé normaldreifð

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

líkindafræði

A

það er undirgrein stærðfræðinnar sem fjallar um líkindi
líkindi er tala á bilinu 0-1 sem segir til um hversu líklegur atburðurinn gerist
- 0 gerist aldrei
- 0,5 gerist helming skipta
- 1 þá gerist alltaf

líkindi eru oft táknuð: P þar sem P stendur fyrir líkur og A táknar atburði
Líkur á því að fá skjaldamerki eru 0.5 eða 50:50 líkur, má tákna P(skjaldamerki)=0.5
Líkur á að fá fimm eða hærra á sexhliða teningi eru 1/3 eða um 33% líkur, má tákna P(sexhliða teningur≥5)=26=13

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

hvernig reiknum við líkur

A

líkur eru fundnar með því að finna hlutfall jákvæðra atburða í fjölda mögulega atburða

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

atburður

A

það er mengi af útkomunni úr líkindatilraun
t.d
Skjaldarmerki” og “Fiskur” í peninga kasti
“fá ás”, “fá tvist”,…,“fá sexu” í teninga kasti
“fjöldi réttra svara” á minnisprófi
“fjöldi stiga” á kvíðalista

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

úrtaksrúm

A

táknað með S er mengi af öllum mögulegum útkomum úr líkindatilraun
t.d
Peningur S = {Skjaldarmerki, Fiskur}
Sexhliða teningur S = {1,2,3,4,5,6}
20 atriða minnispróf S = {0,1,2,…,19,20}
10 atriða kvíðalisti S = {0,1,2,…,9,10}

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Dæmi um líkindatilraun

A

Með því að endurtaka líkindatilraunir (t.d. kasta pening aftur og aftur) þá verður hlutfallið af útkomum þar sem atburður gerist (t.d. fá skjaldarmerki) að réttum líkum (hér 0,5 þ.e. P(skjaldamerki) = 0,5).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

regla um andstæða atburði

A

Líkurnar á því að atburður gerist EKKI er einn mínus líkur á að atburður gerist P(¬A)=1−P(A)
Ef líkur á því að atburður gerist eru 0,70 þá eru líkur á því að atburður gerist ekki 0,30 (1 - 0,70 = 0,30)
Ef það eru 60% líkur á því að atburður gerist, þá eru 40% líkur á því að atburður gerist ekki (100% - 60% = 40%)

16
Q

summureglan

A

Summureglan (addition rule) líka kölluð “eða reglan” (OR rule).
Líkurnar á því að tveir ósamrýmanlegir atburðir (mutely exclusive events) gerist er summa atburðanna.
P(A eða B)=P(A)+P(B)
ef A og B geta ekki gerst á sama tíma.

Dæmi:
Ef nemendur í háskóla geta aðeins verið skráðir í eina deild og það eru 20% nemenda í sálfræði og 10% nemenda í hjúkrunarfræði þá er P(sálfræði) = 10% og P(hjúkrunarfræði) = 20%
Þar sem nemandi getur einungis verið skráður í eina deild þá er hlægt að nota samlagningarregluna til þess að finna líkurnar á því að vera í sálfræði eða hjúkrunarfræði P(sálfræði) + P(hjúkrunarfræði) = 20% + 10% = 30%.

17
Q

margföldunarreegla

A

Líkur á því að tveir óháðir atburðir (independent events) gerist er margfeldi atburðanna.
P(A og B)=P(A)P(B)
, þ.e. þegar útkoma A hefur engin áhrif á útkomu B eða öfugt.

Dæmi:
Ef við hendum sexhliða tening, hverjar eru líkurnar á því að fá sexu þrisvar sinnum í röð?
Líkur á því að fá eina sexu á teningi eru P(fá sex) = 16
Þar sem hvert teningakast eru óháðir atburðir þá getum við notað margföldunarregluna til þess að finna líkurnar á því að fá sexu þrisvar sinnum í röð P(fá sex)P(fá sex)P(fá sex) = 16∗16∗16=1216=0,005
eða (16)3=1216=0,005

18
Q

líkindafræði

A

líkanið af heiminum er þekkt, notum líkanið til þess að reikna út líkur á því að atburður gerist
líkindalíkið er þekkt en gögnin eru óþekkt

19
Q

tölfræði

A

líkanið af heiminum er óþekkt, notum gögnin til þess að finna tölfræðilíkanið
tölfræðilíkanið er óþekkt en gögnin eru þekkt

20
Q

Líkindi byggð á tíðni

A

Líkindi eru fundin með endurteknum líkindatilaunum (probability experiment).
Með því að endurtaka líkindatilraun óendanlega oft fást líkur á því að atburður gerist

21
Q

Líkindi byggð á kenningu Bayes

A

Huglægt mat (subjective) á líkum.
Líkindi eru skilgreind út frá trú okkar á því (degree of belief) að atburður gerist.
Líkindi byggja á fyrri reynslu, uppfærum líkurnar með nýjum gögnum.
Líkindi eru ekki eitthvað sem fyrirfinnst í veruleikanum heldur er stærð sem hugsandi vera (rational agent) gefur atburðinum.

22
Q

slembistærð/slembibreyta

A

Gerum ráð fyrir að breyta X
sem við höfum áhuga á megi lýsa með slembistærð / slembibreytu.
Slembibreyta X getur verið einhver breyta sem við höfum áhuga á t.d. þunglyndiseinkenni í þýði Íslendinga eða aldur nemenda í þýði sálfræðinema

Slembibreytur/slembistærðir eru stærðir sem við gerum ráð fyrir að hafi ákveðna líkindadreifingu (probability distribution).

Við höfum tæknilega ekki áhuga á gildinu sjálfu heldur dreifingunni sem þær koma úr.

Ef við þekkjum dreifinguna vitum við hvernig eiginleikinn lítur út.

23
Q

líkindadreifingar

A

Tvíkosta dreifing (binomial distribution)
Normal dreifing (normal distribution)
Poisson dreifing (Poisson distribution)
χ2
dreifing (χ2
distribution)
F dreifing (F distribution)
Þær hafa ólíka lögun og ólíka eiginleika.

24
Q

normal dreifing

A

Þegar breytur eru samfelldar og lögun dreifingarinnar nálgast normaldreifingu getur verið gagnlegt að nota normaldreifingu.
Þurfum tvo stika (parameters) til þess að lýsa normaldreifingu
Meðaltal (mean) μ
Staðalfrávik
Til þess að nota normaldreifingu til þess að finna líkur á því að atburður gerist byrjum við finna staðalstig Z=x−μσ
Notum svo z-skorið til þess að finna líkur á því að atburður gerist, t.d. með því að notum tölvu til þess að reikna þetta út fyrir okkur eða flettum upp í z-töflu.

25
Q

Bernoulli-tilraun

A

tveir möguleikar á niðurstöðu: “sigrar” (eða “success”) og “tapar” (eða “failure”). Þetta hugtak er uppgötvað af franska stærðfræðingnum Jacob Bernoulli.

Einkenni Bernoulli-tilraunar:

Tvær niðurstöður: Hver tilraun hefur aðeins tvær mögulegar niðurstöður.
Óháðar tilraunir: Niðurstöður tilraunanna eru óháðar hver annarri.
Fastar líkur: Líkur á “sigrar” og “tapar” eru alltaf þær sömu í hverri tilraun.
Dæmi um Bernoulli-tilraunir eru: að kasta mynt (krónu eða fót), að svara spurningu rétt eða rangt, eða að kanna hvort viðskiptavinur kaupi vöru eða ekki.

Bernoulli-tilraunir liggja til grundvallar ýmsum tölfræðilegum dreifingum, sérstaklega binomískri dreifingu, sem lýsir fjölda “sigra” í ákveðnu fjölda Bernoulli-tilrauna

26
Q

lýsandi tölfræði

A

Taka saman gögn sem við þekkjum og lýsa þeim.
T.d með lýsistærðum (statistics) eins og meðaltali og miðgildi
T.d. með kassariti og stöplariti
Lýsistærðir er þekkt tala sem er breytileg á milli úrtaka

27
Q

ályktunartölfræði

A

Að læra eitthvað um hið óþekkta með því að skoða gögn.
T.d. draga ályktun um þýði með því að skoða úrtak.
Stiki (parameter) þýðis er föst tala sem er óþekkt.

28
Q

Lögmál stórra talna

A

Við það að stækka úrtakið (N⟶∞
) þá stefnir meðaltal úrtaksins á meðaltal þýðis (X¯⟶u).

29
Q

Markgildissetningin

A

Við það að stækka úrtakið (N⟶∞
) þá stefnir meðaltal úrtaksins á normaldreifingu.

30
Q

úrtakadreifing

A

Lýsistærðir eins og meðaltal og staðalfrávik eru slembistærðir sem eru dregnar úr líkindadreifingu.

Úrtakadreifing lýsistærðar er líkindadreifing hennar.

Meðaltal úrtakadreifingar er:
μx¯=μx

Staðalfrávik úrtakadreifingar / Staðalvilla meðaltals (Standard error of the mean) er:
SEM=σN‾‾√

31
Q

öryggisbil

A

Segir okkur hversu viss við getum verið um að þýðistalan (stiki þýðis - population parameter) liggi á þessu bili.

Öryggisbilið segir okkur ekki hversu líklegt er að þýðistalan sé inn í bilinu.

Heldur segir öryggisbilið okkur að ef við endurtökum tilraun óendanlega oft þá segir öryggisbilið til um fjölda öryggisbila sem inniheldur þýðistöluna.
þar sem z
er öryggið sem vísað er í.

Dæmi um algeng öryggisbil

68%CI=X¯±σn√
95%CI=X¯±1.96σn√
99%CI=X¯±2.576σn√

Túlkun á öryggisbilum byggir á skilgreiningu “frequentista” á líkum en ekki “Bayesian nálgun”. Þ.e. líkur eru fundnar með því að endurtaka líkindatilraun óendalega oft.

32
Q

úrtök, þýði og að draga úrgtök

A

Með því að nota einfalt tilviljunar úrtak (simple random) eru jafnar líkur fyrir alla í þýðinu að lenda í úrtakinu.

33
Q

úrtakskekkja

A

Ef úrtak er ekki valið með slembivali þá er hætta á því að fá skekktar niðurstöður.
Niðurstöður úrtaksins gefa því ranga mynda af þýðinu.
Niðurstöður úrtakanna þriggja gefa til kynna að úrtakið samanstandi einungis af ⚫
En ef þýðið er skoðað sést að það eru 60%⚪ og 40%⚫

34
Q

tegundir af úrtökum

A

Erum lang sjaldnast með einföld tilviljunar úrtök.
Dæmi um annars konar úrtaksgerð (sampling design) sem er oft notuð þegar ekki er hægt að gera einfalt tilviljunar úrtak.
Lagskipt úrtak (Stratified sampling)
Snjóboltaúrtak (Snowball sampling)
Hentugleika úrtak (Convenience sampling)

35
Q

lagaskipt úrtak

A

Þýðinu er skipt niður í ákveðna hópa (sub population) sem eru kallaðir lög (starta).
Dæmi um lag gæti verið landshluti, kyn, aldur eða ákveðinn hópur með einhver einkenni.
Það geta verið nokkur lög í úrtaki.
Í stað þess að taka einfalt tilviljunar val úr þýðinu í heild sinn þá eru tekin einföld tilviljunarúrtök úr hverju lagi.
Er mjög gagnlegt þegar ákveðið sub population er sjaldgæft.
T.d. ef við værum að gera rannsókn á stelsýki (kleptomaniu) þá er tíðni stelsýki í almennu þýði um 0.3-0.6%
Hér þyrftum við að skipta úrtakinu í tvennt, stelsjúkir og ekki stelsjúkir.
Tækjum úrtak þannig að hlutfallið í báðum hópum verður jafnt, þessi aðferð kallast oversampling.

36
Q

snjóboltaúrtak

A

Aðferð sem er notuð þegar erfitt er að ná í ákveðinn hóp eða ákveðinn hópur í þýðinu er falinn.
T.d. þegar það er ekki til einhver listi yfir einstaklinga í þýðinu.
Rannsakandi hefur samband við nokkra í þýðinu sem á að rannsaka. Þátttakendur eru beðnir um að stinga upp á nokkrum öðrum úr hópnum sem gætu viljað taka þátt í rannsókninni.
Nýju þátttakendunum er boðið að taka þátta í tilrauninni. Þessu er haldið áfram þangað til nægur fjöldi þátttakanda er kominn í rannsóknina.
Kostur aðferðarinnar er að það næst í fólk sem hefði verið ólíklegt að ná til.
Ókosturinn er að úrtakið er ekki tilviljunarúrtak og því erfitt að draga tölfræðilegar ályktanir út frá niðurstöðunum.
Hentar ef til vill betur í eigindlegum rannsóknum (qualitative research)
Annar ókostur er að það getur verið ástæða fyrir því að hópurinn sé falinn og því ekki siðferðislega rétt að afhenda upplýsingar um hver tilheyrir hópnum.
Sérstaklega ef þessar rannsóknir eru gerða á samfélagsmiðlum.

37
Q

hentugleik úrtak

A

Þátttakendur velja sjálfir hvort þeir séu í úrtaki eða ekki.
Þeir eru því ekki valdir af handahófi úr þýðinu.
Snjóboltaúrtak er tegund af hentugleika úrtaki.
Getur valdið skekkju í úrtaki.
Getur skapað mikinn vanda í túlkun niðurstaðna.