Learning statistics with jamovi: a tutorial for psychology students and other beginners (7 Introduksjon til sannsynlighet) Flashcards

1
Q

Hva er sannsynlighetsteori?

A

Sannsynlighetsteori er “læren om sjanser”. Det er en gren av matematikken som forteller deg hvor ofte ulike typer hendelser vil skje. For eksempel er alle disse spørsmålene ting du kan svare på ved hjelp av sannsynlighetsteori:

  1. Hva er sjansene for at en rettferdig mynt kommer opp 10 ganger på rad?
  2. Hvis jeg kaster en sekssidig terning to ganger, hvor sannsynlig er det at jeg kaster to seksere?
  3. Hvor sannsynlig er det at fem kort trukket fra en perfekt blandet kortstokk alle vil være hjerter?
  4. Hva er sjansene for at jeg vinner i lotto?

Legg merke til at alle disse spørsmålene har noe til felles. I hvert tilfelle er “verdens sannhet” kjent, og spørsmålet mitt er knyttet til “hva slags hendelser” som vil skje. I det første spørsmålet vet jeg at mynten er rettferdig, så det er 50 % sjanse for at en individuell myntsving kommer opp. I det andre spørsmålet vet jeg at sjansen for å kaste en 6’er på en enkelt terning er 1 av 6.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Motsetning til sannsynlighetsteori er statistikk. Hva kjennetegner statistikk?

A

Statistiske spørsmål fungerer omvendt fra sannsynlighetsteori. I statistikk vet vi ikke sannheten om verden. Alt vi har er dataene, og det er fra dataene vi ønsker å lære sannheten om verden. Statistiske spørsmål har en tendens til å se mer ut som disse:

  1. Hvis vennen min slår en mynt 10 ganger og får 10 hoder, spiller de meg et puss?
  2. Hvis fem kort fra toppen av stokken alle er hjerter, hvor sannsynlig er det at bunken ble blandet?
  3. Hvis lotterikommissærens ektefelle vinner i lotteriet, hvor sannsynlig er det at lotteriet er rigget?

Denne gangen er det eneste vi har data. Det jeg vet er at jeg så vennen min slå mynten 10 ganger, og den kom opp hver gang. Og det jeg vil utlede er om jeg skal konkludere med at det jeg nettopp så faktisk var en rettferdig mynt som ble snudd 10 ganger på rad, eller om jeg skulle mistenke at vennen min spiller meg et puss.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hva er de to store hovedtilnærmingene innenfor statistiske ideologier og sannsynlighet?

A
  1. Det frekventistiske syn
  2. Bayesiansk syn
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Forklar det frekventistiske synet

A

det definerer sannsynlighet som en langsiktig frekvens . Anta at vi skulle prøve å snu en rettferdig mynt om og om igjen.

Vend en rettferdig mynt om og om igjen, og som
N vokser seg stor (nærmer seg uendelig), vil
andelen hoder vil konvergere til 50 %.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Forklar det bayesianske synet

A

Det bayesianske synet på sannsynlighet kalles ofte det subjektivistiske synet, og selv om det har vært et minoritetssyn blant statistikere, har det stadig fått gjennomslag de siste tiårene.

EKS:
Men for at denne tilnærmingen skal fungere, trenger vi en måte å operasjonalisere “grad av tro”. En måte du kan gjøre dette på er å formalisere det i form av “rasjonell gambling”, selv om det er mange andre måter. Anta at jeg tror at det er 60 % sannsynlighet for regn i morgen. Hvis noen tilbyr meg en innsats om at hvis det regner i morgen, vinner jeg $5, men hvis det ikke regner, taper jeg $5. Det er klart, fra mitt perspektiv, er dette en ganske god innsats. På den annen side, hvis jeg tror at sannsynligheten for regn bare er 40% så er det en dårlig innsats å ta. Så vi kan operasjonalisere forestillingen om en “subjektiv sannsynlighet” i form av hvilke spill jeg er villig til å akseptere.

Fordel og ulempen er:
Den største fordelen er at den lar deg tilordne sannsynligheter til enhver hendelse du vil. Du trenger ikke være begrenset til de hendelsene som kan gjentas. Den største ulempen (for mange mennesker) er at vi ikke kan være rent objektive.

Det frekventistiske synet tillater ikke to observatører å tilskrive forskjellige sannsynligheter til samme hendelse. Når det skjer, må minst én av dem ta feil

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hva er en sannsynlighetsfordeling og total sannsynlighet?

A

EKS:
Jeg har 5 par med bukser. Sannsynligheten for at jeg bruker dem er mellom 0 og 1.

la oss si at jeg bruker svart bukse 20% av tiden, blå bukse 40% rød bukse 10%, grå bukse 30% og lille bukse 0%.

Hver av hendelsene har en sannsynlighet som ligger mellom 0 og 1, og legger vi sammen sannsynligheten for alle hendelsene summerer de til 1, dette er total sannsynlighet i en sannsynlighetsfordeling.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hva er de fem distribusjoner av fordelingene?

A

binomialfordelingen
normalfordelingen
t-distribusjon
X^2(“chi-square”) distribusjon
F-distribusjon.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Forklar kort hva binominalfordeling er

A

Sannsynsteorien har sitt opphav i forsøket på å beskrive hvordan sjansespill fungerer, så det virker passende at vår diskusjon om binomialfordelingen bør involvere en diskusjon om terningkast og myntkast. La oss forestille oss et enkelt “eksperiment”. I min varme lille hånd holder jeg 20 identiske seks-sidige terninger. På en side av hver terning er det et bilde av en hodeskalle, de andre fem ansiktene er alle tomme. Hvis jeg fortsetter å kaste alle de 20 terningene, hva er sannsynligheten for at jeg får nøyaktig 4 hodeskaller.

Så om det brukes en tærning med 6 mulige utfall eller en mynt med to mulige utfall, kan det observeres hvor sannsynlig at et spesifikt tilfelle vil skje.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Forklar kort normalfordeling

A

Dette har vi hatt før. vi har standardavvik og gjennomsnitt

Før jeg går videre vil jeg peke på en viktig egenskap ved normalfordelingen. Uavhengig av hva det faktiske gjennomsnittet og standardavviket er 68,3% av arealet faller innenfor 1 standardavvik fra gjennomsnittet. Tilsvarende 95,4% av fordelingen faller innenfor 2 standardavvik av gjennomsnittet, og 99,7% av fordelingen er innenfor 3 standardavvik.

Viktig poeng angående sannsynlighetstetthet:

Poenget er å gjøre det klart at når vi snakker om kontinuerlige fordelinger er det ikke meningsfylt å snakke om sannsynligheten for en spesifikk verdi. Det vi imidlertid kan snakke om er sannsynligheten for at verdien ligger innenfor et bestemt verdiområde.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Forklart kort t-fordeling

A

t-fordeling er en kontinuerlig fordeling som ligner veldig på en normalfordeling, se figur 7.10 . Merk at “halene” av
t-fordelingen er “tyngre” (dvs. strekker seg lenger utover) enn halene til normalfordelingen). Det er den viktige forskjellen mellom de to. Denne fordelingen har en tendens til å oppstå i situasjoner der du tror at dataene faktisk følger en normalfordeling, men du ikke vet gjennomsnittet eller standardavviket.

Eksempel Figur 7.10

kommer senere i kapittel 11

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Forklar kort X2 distribusjon

A

viser det seg at hovedårsaken til at X^2 fordeling dukker opp over alt, er at hvis du har en haug med variabler som er normalfordelte, kvadrerer verdiene deres og legger dem sammen (en prosedyre referert til som å ta en “kvadratsum”), har denne summen en X^2 distribusjon.

Kommer mer i kapittel 10

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Forklar kort F-distribusjon

A

F-fordeling ser litt ut som en X^2 distribusjon, og den oppstår når du trenger å sammenligne to X^2 distribusjoner til hverandre. Riktignok høres dette ikke akkurat ut som noe enhver fornuftig person ville ønske å gjøre, men det viser seg å være veldig viktig i dataanalyse i den virkelige verden. Husk da jeg sa det X^2 viser seg å være nøkkelfordelingen når vi tar en “sum av kvadrater”? Vel, hva det betyr er at hvis du vil sammenligne to forskjellige «kvadratsummer», snakker du sannsynligvis om noe som har en F-distribusjon.

Kommer mer i kapittel 13

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly