Statistik 3 Flashcards
Spearmans rangkorelationskoefficient
Icke-parametrisk variant av pearsons.
Samma formel som Pearsons korrelationskoefficient, men värdena rangordnas först, och sedan räknas z-värden ut på dessa
- En separat rang räknas för x och en för y
Antaganden för spearmans
- Icke-parametriskt
- båda variabler på ordinalnivå
- fördel att använda vid snedfördelning
- fördel att använda vid extremvärden
- heteroscedasicitet
- fungerar vid monotona icke linjära samband
Varför omvandlas värden till rangvärden i Spearmans?
Gör att extremvärden får mindre påverkan (ex 4 är närmare resterande siffror än 100)
Eftersom ranger används vid Spearmans kan även monotona icke linjära samband användas.
Mann Whitney U
Jämför två grupper på en gemensamt rangordnad variabel
- är motsvarighet till oberoende t-test
Testet prövar om det två frekvensfördelningarna skiljer sig åt.
Testning av Mann Whitney U
Alla värden rangordnas på en gemensam skala där lika värden blir medelrangvärdet.
Rangsumman i varje grupp räknas ut.
U-värdet för vardera grupp räknas ut med det.
Lägsta U värdet av grupperna jämförs mot kritiskt värde.
Om det är lika med eller lägre är det signifikant.
Wilcoxons
Jämför två mätningar på samma deltagare där differensen mellan mätningarna rangordnas.
- Motsvarande till beroende t-test.
Testar om det tenderar att finnas fler/högre positiva än negativa ranger
Hur beräknas Wilcoxons?
Man räknar på varje enskild differens och rangordnar sedan dessa från lägsta till högsta (lägst differens =1). 0 differenser ignoreras och tas bort från n. Alla positiva och negativa differenser rangas utan att ta hänsyn till -+ tecken framför
Summerar positiva och negativa differenser separat
Man jämför det minsta T värdet med kritiska värdet i tabellen - lika med eller lägre än kritiska test = signifikant
chi 2
Används då man har data på nominalnivå från oberoende stickprov för att testa om en frekvensfördelning skiljer sig från den man skulle kunna få av en slump.
Hur beräknas Chi2?
Man använder sig av det observerade värderna, som är de frekvenser man erhållit i sin undersökning och jämför dessa med de förväntade värdena, som är de värden man fått av ren slump.
Effektstorlek
Standardiserade mått på styrkan hos effekt
Effektstorlek - samband
Korrelationskoefficienten (r) är standariserad och kan då användas som mått på effektstorlek.
- då närmare +-1 är starakre och närmare 0 är svagare
Effektstorlek - t-test
Som effektstorlek för skillnader kan vi använda Cohens d
- Cohens d beräknas med en formel av differensen mellan medelvärden delat i s.
och för oberoende mätningar baseras s på den “poolade variansen”
Cohens d - gränser för effektstorlek
d>0.2 - liten effekt
d>0.5 - måttlig effekt
d>0.8 - stor effekt
Vad är statistisk power?
hur bra vårt test är på att klassa sanna hypoteser som sanna
Test med hög power = hög förmåga att upptäcka sanna effekter
Vad är alfanivån?
hur ofta testet klassificerar falska hypoteser som sanna.
Alfanivå avgör hur osannolikt resultatet ska få vara för att man ska förkasta nollhypotesen.
Hur kan vi veta hur sannolikt det är att en effekt är sann om hypotestestet ger bevis för det?
Genom att sätta en alfanivå
- Kan kontrolleras enkelt eftersom H0, som definierar ett särskilt värde för populationsvärdet direkt definierar hur ovanligt det är att få olika stickprovs resultat
Power beror på flera faktorer och kan därmed inte kontrolleras lika precist
Vad kan power påverkas av? (kontrollerbara faktorer)
- Alfanivå - eftersom vi sätter gräns för hur mycket skillnad från H0 behöver vi ha i stickprovet för att säga att effekten är signifikant.
- Höjs alfanivån -> högre power - Storlek på stickprovet - vid större stickprov kan mindre effekter bli mer signifikanta = högre power
- Studiedesign - designer som får bort mer brus i data ger högre power,
- Ex kan beroende mätning få bort individuell variation mellan deltagarna - Typ av test - parametriska har ofta något högre power än icke-parametriska givet att deras antaganden är uppfyllda
Vad påverkas power av? (inte kontrollerbara)
Effektstorleken i populationen - större effektstorlek
- Ex större skillnad i medelvärde -> högre power
Standardavvikelse i population - större s betyder att estimaten varierar mer och gör det svårare att upptäcka signifikanta effekter -> lägre power
Varför är power svårt?
Power beror på saker vi har och inte har kontroll över
Det vi inte har någon kontroll över är den sanna effekten och standardavvikelsen
Eftersom vi inte känner till alla faktorer kan vi för det mesta inte beräkna exakt vilken power vi har. Men vet vi vilken power vi vill ha kan vi se vad som behöver göras för att nå upp till den powern.
Två sätt att räkna ut saker som behövs för högre power
- Gör en bedömning av (standardiserad) effektstorlek från liknande tidigare studier
- Identifiera den minsta (standardiserade) effektstorleken vi är intresserade av att kunna identifiera, och räkna power utifrån att det är effektstorleken
Med denna information tillsammans med information om alfanivå och typ av test kan vi beräkna hur många deltagare (n) vi behöver för att uppnå önskad power
Antaganden för Mann Whitney U
- icke parametriskt
- kan vara snedfördelat
- oberoende test
- något av värdena måste vara på minst ordinalnivå
Antaganden för Wilcoxons
- icke parametriskt
- något av värdena måste vara på minst ordinalnivå
- användbart vid snedfördelning
- beroende test - inomgrupp
Vad är delta?
Eftersom effektstorlekar mäts på olika sätt beroende på vilket test man utför använder man en hjälpvariabel - delta
Med hjälp av delta kan man genom flera olika formler (till olika typer av test) beräkna hur stort stickprov som behövs för att uppnå viss effektstorlek.
(Tabeller visar vilket deltavärde som motsvarar en viss power givet en viss alfanivå)
Hur är power och typ 2 fel kopplat?
Power kan definieras som 1- beta (där beta är risken för typ 2 fel)
Alltså blir en större power lägre risk för typ 2 fel