Statistik 3 Flashcards

1
Q

Spearmans rangkorelationskoefficient

A

Icke-parametrisk variant av pearsons.
Samma formel som Pearsons korrelationskoefficient, men värdena rangordnas först, och sedan räknas z-värden ut på dessa
- En separat rang räknas för x och en för y

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Antaganden för spearmans

A
  1. Icke-parametriskt
  2. båda variabler på ordinalnivå
  3. fördel att använda vid snedfördelning
  4. fördel att använda vid extremvärden
  5. heteroscedasicitet
  6. fungerar vid monotona icke linjära samband
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Varför omvandlas värden till rangvärden i Spearmans?

A

Gör att extremvärden får mindre påverkan (ex 4 är närmare resterande siffror än 100)
Eftersom ranger används vid Spearmans kan även monotona icke linjära samband användas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Mann Whitney U

A

Jämför två grupper på en gemensamt rangordnad variabel
- är motsvarighet till oberoende t-test
Testet prövar om det två frekvensfördelningarna skiljer sig åt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Testning av Mann Whitney U

A

Alla värden rangordnas på en gemensam skala där lika värden blir medelrangvärdet.
Rangsumman i varje grupp räknas ut.
U-värdet för vardera grupp räknas ut med det.
Lägsta U värdet av grupperna jämförs mot kritiskt värde.
Om det är lika med eller lägre är det signifikant.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wilcoxons

A

Jämför två mätningar på samma deltagare där differensen mellan mätningarna rangordnas.
- Motsvarande till beroende t-test.
Testar om det tenderar att finnas fler/högre positiva än negativa ranger

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hur beräknas Wilcoxons?

A

Man räknar på varje enskild differens och rangordnar sedan dessa från lägsta till högsta (lägst differens =1). 0 differenser ignoreras och tas bort från n. Alla positiva och negativa differenser rangas utan att ta hänsyn till -+ tecken framför

Summerar positiva och negativa differenser separat
Man jämför det minsta T värdet med kritiska värdet i tabellen - lika med eller lägre än kritiska test = signifikant

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

chi 2

A

Används då man har data på nominalnivå från oberoende stickprov för att testa om en frekvensfördelning skiljer sig från den man skulle kunna få av en slump.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hur beräknas Chi2?

A

Man använder sig av det observerade värderna, som är de frekvenser man erhållit i sin undersökning och jämför dessa med de förväntade värdena, som är de värden man fått av ren slump.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Effektstorlek

A

Standardiserade mått på styrkan hos effekt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Effektstorlek - samband

A

Korrelationskoefficienten (r) är standariserad och kan då användas som mått på effektstorlek.
- då närmare +-1 är starakre och närmare 0 är svagare

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Effektstorlek - t-test

A

Som effektstorlek för skillnader kan vi använda Cohens d
- Cohens d beräknas med en formel av differensen mellan medelvärden delat i s.
och för oberoende mätningar baseras s på den “poolade variansen”

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Cohens d - gränser för effektstorlek

A

d>0.2 - liten effekt
d>0.5 - måttlig effekt
d>0.8 - stor effekt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Vad är statistisk power?

A

hur bra vårt test är på att klassa sanna hypoteser som sanna
Test med hög power = hög förmåga att upptäcka sanna effekter

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Vad är alfanivån?

A

hur ofta testet klassificerar falska hypoteser som sanna.
Alfanivå avgör hur osannolikt resultatet ska få vara för att man ska förkasta nollhypotesen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hur kan vi veta hur sannolikt det är att en effekt är sann om hypotestestet ger bevis för det?

A

Genom att sätta en alfanivå
- Kan kontrolleras enkelt eftersom H0, som definierar ett särskilt värde för populationsvärdet direkt definierar hur ovanligt det är att få olika stickprovs resultat
Power beror på flera faktorer och kan därmed inte kontrolleras lika precist

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Vad kan power påverkas av? (kontrollerbara faktorer)

A
  1. Alfanivå - eftersom vi sätter gräns för hur mycket skillnad från H0 behöver vi ha i stickprovet för att säga att effekten är signifikant.
    - Höjs alfanivån -> högre power
  2. Storlek på stickprovet - vid större stickprov kan mindre effekter bli mer signifikanta = högre power
  3. Studiedesign - designer som får bort mer brus i data ger högre power,
    - Ex kan beroende mätning få bort individuell variation mellan deltagarna
  4. Typ av test - parametriska har ofta något högre power än icke-parametriska givet att deras antaganden är uppfyllda
18
Q

Vad påverkas power av? (inte kontrollerbara)

A

Effektstorleken i populationen - större effektstorlek
- Ex större skillnad i medelvärde -> högre power

Standardavvikelse i population - större s betyder att estimaten varierar mer och gör det svårare att upptäcka signifikanta effekter -> lägre power

19
Q

Varför är power svårt?

A

Power beror på saker vi har och inte har kontroll över
Det vi inte har någon kontroll över är den sanna effekten och standardavvikelsen

Eftersom vi inte känner till alla faktorer kan vi för det mesta inte beräkna exakt vilken power vi har. Men vet vi vilken power vi vill ha kan vi se vad som behöver göras för att nå upp till den powern.

20
Q

Två sätt att räkna ut saker som behövs för högre power

A
  1. Gör en bedömning av (standardiserad) effektstorlek från liknande tidigare studier
  2. Identifiera den minsta (standardiserade) effektstorleken vi är intresserade av att kunna identifiera, och räkna power utifrån att det är effektstorleken

Med denna information tillsammans med information om alfanivå och typ av test kan vi beräkna hur många deltagare (n) vi behöver för att uppnå önskad power

21
Q

Antaganden för Mann Whitney U

A
  1. icke parametriskt
  2. kan vara snedfördelat
  3. oberoende test
  4. något av värdena måste vara på minst ordinalnivå
22
Q

Antaganden för Wilcoxons

A
  1. icke parametriskt
  2. något av värdena måste vara på minst ordinalnivå
  3. användbart vid snedfördelning
  4. beroende test - inomgrupp
23
Q

Vad är delta?

A

Eftersom effektstorlekar mäts på olika sätt beroende på vilket test man utför använder man en hjälpvariabel - delta
Med hjälp av delta kan man genom flera olika formler (till olika typer av test) beräkna hur stort stickprov som behövs för att uppnå viss effektstorlek.

(Tabeller visar vilket deltavärde som motsvarar en viss power givet en viss alfanivå)

24
Q

Hur är power och typ 2 fel kopplat?

A

Power kan definieras som 1- beta (där beta är risken för typ 2 fel)
Alltså blir en större power lägre risk för typ 2 fel

25
Q

Vad är typ 1 fel?

A

förkastar 0 hypotes fast H0 är sann.
- påstås att det finns effekt fast det inte finns

26
Q

Vad är typ 2 fel?

A

behålla H0 fast alternativhypotes är sann
- påstå att ingen effekt finns fast det finns en effekt

27
Q

Hur påverkar nivån av prior sannolikheten av resultatet?

A

För det flesta priors är det en ganska hög chans, men om priorn är låg - alltså om vi ofta testar osanna hypoteser - då är sannolikheten att ett signifikant resultat är sant fortfarande låg.

28
Q

Vilka begränsningar finns för power?

A

Om vi överskattar effektstorlekar, då är vår power lägre än vad vi ville ha
- Därmed också lägre chans att effekter vi tror på är sanna

Har argumenterats att forskare tenderar att överskatta effektstorlekar - de tror på sina hypoteser, och tror därmed att effekten är större än den är

29
Q

Vad har extremvärden för påverkan på statistiska test?

A

Det kan ofta ha en oproportionerligt stor påverkan
- en vanlig tumregel för om det är ett extremvärde är att sätta en gräns på tre standardavvikelser från medelvärdet

30
Q

Vad är möjliga lösningar för extremvärden?

A
  • ta bort värdena
  • använda icke parametriska test
31
Q

Vad är massignifikansproblemet?

A

Om man gör flera signifikansprövningar och använder en viss alfanivå för varje prövning blir det totala risken för att man gör ett typ 1 fel större än den valda alfa.
(signifikansprövningar som alla är under samma övergripande hypotes)

Med andra ord kommer en av prövningarna bli signifikanta även om en effekt inte finns.

32
Q

Hur kan vi korrigera massignifikansproblemet?

A

För oberoende test finns en formel för att korrigera massasignifikans mellan alla prövningar.

Vid test som är beroende behövs bonferroni-korrigering.

33
Q

Vad är bonferroni korrigeringen?

A

dela alfanivå a med antalet test som görs k, då kommer sannolikheten för minst ett signifikant resultat som mest vara a igen.
Bonferroni sänker dock power för ett enskilt test (svårare få signifikant resultat)

34
Q

Vad är replikationskrisen?

A

Att vissa resultat inte replikeras eller kan replikeras

35
Q

Varför sker replikationskrisen?

A
  1. Publikationsbias - lägger ut signifikanta resultat o inte annat
  2. P-hacking - vi gör många test och bara publicerar de som blir signifikanta
  3. HARKing - att hypotisera efter resultaten har visats
  4. felanvänd statistik

Alla ovanstående faktorer kan öka risken för Typ 1 fel.
1-3 hänger ihop medmassignifikans

36
Q

Vad är lösningar till replikationskrisen?

A

Högre transparens
Förregistrering (pre-registration)
Högre power, lägre alfanivå
Mer omfattande studier, större stickprov, fler replikationer

37
Q

Vad är invers sannolikhet?

A

?

38
Q

Vad kan hända vid små stickprov? (med signifikans nivån)

A

Med små stickprov blir bara väldigt stora effekter signifikanta
-> Detta kan leda till en överskattning av effektstorlek

39
Q

Vad kan hända vid stora stickprov? (med signifikans nivån)

A

Med stora stickprov blir även väldigt små effekter statistiskt signifikanta
-> Kontrollera därmed praktisk signifikans (effektstorlek)

40
Q

Vad är regressionsfelslutet?

A

Ett exempel på hur sättet som sannolikheter fungerar kan leda till missvisande resultat
Säger att om vi väljer ut de deltagare som fått högst (eller lägst) resultat på ett test, då kommer deras resultat på nästa test hamna närmare medelvärdet

Därmed: om de hade höga resultat kommer de ha ett lägre resultat nästa gång (i snitt)
Eftersom vi plockar ut de som råkat få högst resultat betyder det inte att det kommer följa med

41
Q

Vad är restriction of range och hur kan det påverka andra statistiska test än korrelationer?

A

restriction of range är fenomen inom statistik där spridningen i en eller flera variabler är begränsad. Detta har effekt för om man kan se en korrelation men även att upptäcka andra effekter.
- dålig spridning ökar även risken för typ 2 fel.

42
Q

Vad är skillnaden mellan hypotesprövande resultat och post hoc fynd?

A

Har en teori testats med en bestämd teori har teorin utsatts för hårdare prövning än om man i efterhand råkar hitta data som går i linje med teorin

Problemet med post hoc fynd är också att man alltid kan komma med efterhandskonstruktioner som förklarar sådana fynd