Föreläsning 3 Flashcards

1
Q

Vad är ett parametriskt test?

A

Parametriska test bygger på antaganden om en viss fördelning i en populations data. Testerna är utformade för att göra inferenser om populationens parametrar.
- Normalfördelning, intervall eller kvotskalenivå
- t-test och chi

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Krav för ett beroende t-test

A
  • inomgruppsdesign (före och efter en intervention)
  • differenspoängen för varje individ!
  • normalfördelning
  • intervall eller kvotskalenivå
  • homogenitet av varians
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Krav för ett oberoende t-test

A
  • testar medelvärdesskillnaden i två oberoende grupper
  • bygger på antagandet om normalfördelning och lika varians mellan grupperna
  • H1 = det finns en signifikant skillnad mellan grupperna
  • Mann Whitney U används istället ex.v. vid brist på normalfördelning
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Nämn några faktorer som påverkar den statistiska powern

A
  • stickprovsstorlek
  • urval (slumpmässigt?)
  • alfanivå: tröskeln för att förkasta nollhypotesen. Högre alfanivå = större risk att vi betraktar falska hypoteser som sanna
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Box plot

A
  • visuell sammanfattning gällande fördelningen av variabler
  • ger oss mått som kvartiler och median
  • centrala läget och spridning
  • bra för att se avvikesler, spridning samt jämföra olika grupper
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Histogram

A
  • visar fördelningen av en variabel genom att dela upp dem i olika staplar
  • visar antal observationer inom varje intervall
  • visuell representation av spridning och frekvensfördelning
  • ser tendenser och skiftningar i fördelningen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Nämn tre icke-parametriska test och dess motsvarigheter i parametriska test

A
  • Mann Whitney U : oberoende t-test
  • Spearmans rangordningskoefficent : pearsons korrelationskoefficent
  • Wilcoxon : beroende t-test
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Pearsons korrelationskoefficent

A

Grad av samvariation
- linjär samvariation
- används för att mäta hur starkt och i vilken riktning två variabler förändras tillsammans
- +1 = perfekt positiv korrelation
- -1 perfekt negativ korrelation
- 0 = ingen korrelation

påverkas av extremvärden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Spearmans rangkorrelationskoefficient

A

Används istället för pearsons r när det finns avvikande observationer, och sambandet behöver nödvändigtvis inte vara linjärt
- beräknas genom att jämföra rangordningen av variablerna snarare än de exakta värdena
- får ut z-värdena

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

icke-parametriskt test

Wilcoxon

A

Används för att jämföra skillnader mellan två beroende grupper när antagande om normalfördelning eller homogenitet av varians inte är uppfyllda

ist för beroende t-test

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Mann Whitney U

A

Jämförelse av två oberoende grupper för att avgöra om det finns en signifikant skillnad mellan dem. Det används när data inte följer normalfördelningen och när man arbetar med ordinal- eller rangordnade data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Chi två test

A

Undersöker om det finns ett signifikant samband mellan två kategoriska variabler
- nominalskalenivå

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

För och nackelar parametiriska / icke-parametriska test

A
  • Icke-parametriska test har högre power när data inte är normalfördelad (lägre dock när den är normalfördelad)
  • Det är inte alla test som har icke-parametriska varianter
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Behöver en effekt vara stark för att den ska vara signifikant?

A

nej.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Vad händer med vårt estimat när vi tar större stickprov?

A

Det kommer närmre den faktiska parametern

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Vad är en effektstorlek?

A

“Hur stor är skillnaden?”
“Hur starkt är sambandet?”
Kvantitativ indikation på styrkan av en effekt eller ett samband mellan variabler

Mäts genom Cohens D

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Cohens D

A

Kvantifierar storleken för medelvärdena mellan två grupper
- 0,1 = svag 0,3 = medelstark 0,5 = stark korrelation (vid mått på korrelationskoefficent) OBS inte Cohens D endast r
- D = X1-X2/ den gemensamma standardavvikelsen
- Cohens D uttrycker skillnaden mellan medelvärdena i termer av standardavvikelser
- liten = 0,2 medelstor = 0,5 stor = 0,8 (t-test)

18
Q

För att veta hur sannolikt det är att en effekt är sann om hypotestestet ger bevis för det behöver vi veta tre saker, vilka?

A
  • Prior: hur ofta vi testar sanna hypoteser
  • Power: hur ofta testet klassificerar sanna hypoteser som sanna
  • Alfanivå: hur ofta testet klassificierar falska hypoteser som sanna
19
Q

Vad menas med att ett test har hög power?

A

Testet har en hög förmåga att upptäcka sanna effekter

20
Q

Vad finns det för faktorer som påverkar den statistiska powern?

A
  • Alfanivå
  • Stickprovsstorlek
  • Studiedesign (får bort brus = högre power)
  • Typ av test (bättre med parametriska förutsatt att kraven uppfylls)
21
Q

Vad är det vi inte har någon kontroll över när vi mäter statistisk power?

A

Den sanna effekten och standardavvikelsen

22
Q

Vad är standardfelet?

A
  • Ett mått på osäkerheten i medelvärdet
  • Spridningen eller variationen av stickprovsmedelvärdet runt det sanna populationsmedelvärdet

Standardfelet används ofta tillsammans med konfidensintervall och hypotesprövning för att ge en uppfattning om hur exakt en uppskattning är. Ett mindre standardfel indikerar en mer precisa uppskattningar, medan ett större standardfel indikerar större osäkerhet.

23
Q

Om vi ska mäta effektstorlek för ett t-test, vad ska cohens d ligga på för att det ska vara en liten, måttlig respektive stor effekt?

A
  • Liten: 0,2
  • Måttlig: 0,5
  • Stor: 0,8
24
Q

Vad är massignifikansproblemet?

A

Typ: utför många tester utan att justera för den ökade risken att dra felaktiga slutsatser. Chansen/risken att hitta något som är signifikant ökar av enbart slumpen när många tester utförs.
Falska positiva resultat och drar slutsatser om verklig signifikans - ett resultat av att göra många tester och fokusera på de tester man “vill ha”

25
Q

Vad menas med att ha en alfanivå på 5%?

A

Att vi tolererar en 5%ig risk för typ 1 fel, dvs att om nollhypotesen är sann så acceperar vi en 5%ig risk för att felaktigt förkasta den

26
Q

Vad är standardfel respektive standardavvikelse? Hur relaterar dessa till varandra?

A

Standardavvikelse ger en indikation på hur mycket data varierar. Används för att få en uppfattning om hur mycket individuella data avviker från medelvärdet (i snitt?)
Standardfelet indikerar hur mycket det uppskattade medelvärdet från stickprovet kan variera runt det sanna populationsmedelvärdet. Standardavvikelse i stickprov??

27
Q

Vad säger det oss ifall vi fått ett litet standardfel?

A

Ju mindre standardfelet, desto mer precision i uppskattningen av det faktiska populationsmedelvärdet

28
Q

På vilket sätt är standardfelet viktig för beräkningen av KI?

A

De används tillsammans för att ge information om osäkerheten i uppskattningen kring populationsparametrar (medelvärde vanligtvis)
- Standardfelet används för att beräkna bredden på konfidensintervallet
- Smalare KI och mindre SE = mer precision i uppskattningen

29
Q

Vad är ett z-värde?

A

Z-värde visar hur mycket individuell data avviker från medelvärdet mätt i antal standardavvikelser (σ)
- Positivt z-värde = ovanför mv, negativt z-värde = under mv

30
Q

Aka sannolikhetsvärdet ?

Vad är ett p-värde?

A

P-värdet representerar sannolikheten för att observera de resultat vi gjort om nollhypotesen skulle vara sann
- Alltså, har vi ett p-värde på 0,05 så är det endast 5% sannolikhet att vi skulle observera de resultat vi gjort om H0 är sann, vilket gör att vi kan förkasta H0 till förmån för H1 om vi uppmätter resultat med ett lägre p-värde

31
Q

Hur relaterar storleken på konfidensintervallet till antal observationer som gjorts?

A

KI-storleken är inversproportionell mot antal observationer
- Fler observationer i stickprovet = mindre KI
- Färre observationer i stickprovet = större KI

32
Q

μ

A

populationsmedelvärdet

33
Q

σ

A

Standardavvikelsen i populationen

34
Q

Vilken är den icke-parametriska motsvarigheten till oberoende t-test?

A

Mann Whitney-U

35
Q

Vilken är den icke-parametriska motsvarigheten till beroende t-test?

A

Wilcoxon

36
Q

Varför bör man inte använda icke-parametriska test när kraven för parametriska test är uppfyllda?

A
  • Mindre power: kan vara mindre känsliga för att upptäcka verkliga effekter om de existerar
  • Mindre precision: bygger på rangordning av data och kan därför förlora info om de exakta värdena
  • Mindre förmåga att hantera små effekter
37
Q

Vad är kraven för att använda ett parametriskt test?

A
  • Normalfördelning
  • Homogenitet av varians
  • Skalnivå (kräver högre skalnivå)

Finns andra saker men dessa är de viktigaste ?

38
Q

Ge exempel på några statistiska fallgropar

A
  • P-hacking
  • Massignifikans
  • Urvalsbiazzz
  • Korrelation=/= kausalitet (dra slutsatser som om det ena indikerade det andra, bortse från ovv)
  • Förfalskning (medvetet manipulera data för att stödja ökade slutsatser)
39
Q

Vad är en tvåsidig prövning?

A

man vet typ inte i vilken riktning hypotesen kommer gå eller nåt sånt fattade ej riktigt

40
Q

Tass.se

Vad finns det för faktorer som påverkar den statistiska powern?

A

Typ av test: parametriska test har större power än icke-parametriska (förutsatt att kraven uppnås)
Alfanivå: högre alfanivå gör det lättare att hitta en sann effekt = högre power
Stickprovsstorlek: större stickprov = högre power
SD i populationen: större SD = större variation i estimat, svårt att upptäcka sanna effekter
Studiedesign: designer som får bort mer brus ger högre power
Effektstorlek: större effektstorlek = lättare att upptäcka den