Introföreläsning Flashcards

1
Q

Parameter

A

En sammanfattande kvantitet (dvs en siffra) som beskriver populationen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Statistika

A

En sammanfattande kvantitet (dvs en siffra) som beskriver stickprovet.

Vissa statistiska kan vara meningsfulla som estimatorer för populationen, ex. medelvärde, sd och varians.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Deskriptiv statistik

A

Sammanfattning av stickprovsdata med olika statistika.

Ex. medelvärde, median, standardavvikelse, formen på stickprovsfördelningen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Inferentiell statistik

A

När vi använder stickprovsdata för att dra slutsatser om populationen. Dvs att vi gör en inferens.

“Är funnen effekt i stickprovet sann i populationen?”

Då behöver vi göra en hypotesprövning

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hypotesprövning

A

En hypotes är en kvalificerad gissning avseende någon kvantifierbar egenskap i populationen.

Nollhypotesen (H0): Det är ingen skillnad mellan två grupper/betingelser avseende någon beroendevariabel, alternativt att det inte är något samband mellan två variabler i populationen.

Alternativhypotesen (H1): Det är en skillnad alt. det finns ett samband.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Parametrisk statistik

A

När det är möjligt att estimera parametrar, d.v.s. populationsn medelvärde och standardavvikelse, utifrån stickprovet.

Förutsätter:
* att vi har data på kvot- eller intervallskala
* att stickprovet är normalfördelat om det är litet
* att vi har homogen varians

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Normalfördelning

A

Viktig inom parametrisk statistik.

Avvikelser från normalfördelning:
* skewness
* kurtosis

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Standardfelet

A

Avvikelsen mellan medelvärden, om vi hade upprepat testet på många stickprov

eller:

Standardfelet beskriver hur mycket stickprovsmedelvärdena kommer att variera kring populationsmedelvärdet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Centrala gränsvärdessatsen

A

När stickprovet är tillräckligt stort kommer fördelningen över stickprovsmedelvärden närma sig normalfördelningen, oavsett hur stickprovets fördelning ser ut.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

p-värdet

A

Sannolikheten för att få ett testresultat som är minst lika extremt som det erållna resultatet, givet att nollhypotesen är sann.

Ett litet p-värde anger att nollhypotesen är falsk alternativt att en osannolik händelse har inträffat.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Power

A

Sannolikheten att finna en sann effekt.

Power ökar med:
* Alpha-nivån
* Effektstorleken. Och effektstorleken kan ökas med ökad mätprecision
* Stickprovsstorlek

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Effektstorlek/-styrka

A

Om vi vet att det finns en skillnad eller ett samband så vill vi veta hur stor skillnaden är eller hur starkt sambandet är. Då vill vi beräkna effektstorleken.

För vissa variabler är det lätt att tolka effektstorleken, ex vikt (en medicin som gör att man går ned 10 kg är bättre än en som gör att man går ned 1 kg). Sådana icke-standardiserade effektstorlekar är beroende av måttenheter (ex vikt).

Men för många variabler är det svårare att tolka effekten, och man vill därför använda en standardiserad effektstorlek. De är dessutom oberoende av måttenheter och kan därför bättre jämföras.

Större standardavvikelse ger en lägre standardiserad effektstorlek.

Effektstorlekar är alltid punktestimat och därför förknippade med osäkerhet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Cohens d

A

För skillnader mellan två medelvärden. Används alltså för effektstorlekar vid t-test.

0.2 = liten
0.5 = medium
0.8 = stor

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Bayesiansk statistik

A

En inriktning inom inferentiell statistik, där man inte bara testar om resultatet är osannlikt givet nollhypotesen, utan även om resultat är sannolikt givet alternativhypotesen.

På så sätt kan man utvärdera om resultatet utgör evidens för den ena eller den andra av hypoteserna, eller kanske inte är evidens för NÅGON av hypoteserna.

Bayesiansk slutledning grundar sig i att den hypotes som bäst predicerade resultatet är den hypotes som får mest stöd av resultatet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Bayesfaktorn

A

Sannolikheten för ett visst resultat givet en viss hypotes, dividerat med sannolikheten för ett visst resultat givet ett annan hypotes.

Är ett direkt mått på stödet FÖR eller MOT en statistisk hypotes, jämfört med p-värdet som bara används som evidens MOT nollhypotesen.

Bf är ett sätt att kvantifiera HUR mycket mer stöd alternativhypotesen får än nollhypotesen.

Ett högt värde på Bayesfaktorn indikerar ett starkt stöd för hypotesen i jämförelse med alternativet.

Bf < 1 = mer stöd åt H0 än H1
Bf > 1 = mer stöd åt H1 än H0
Bf = 1 = båda hypoteserna predicerade stickprovsresultatet lika väl

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Skillnader mellan p-värde och Bf

A
  • Bf kan varierar mellan 0 och oändlighet. P-värde bara mellan 0 och 1
  • Bf kan tolkas direkt som kvoten mellan sannolikheter att erhålla resultat givet olika hypoteser. P-värdet har inte en enkel tolkning, utan är ett index mot nollhypotesen
17
Q

Fördelar med Bayesfaktorn

A
  • Stöder för eller emot H0 utvärderas kontinuerligt. Mer svartvitt med nollhypotesprövning (behåll eller förkasta)
  • Båda hypoteserna kan få stöd. I nollhypotesprövning kan H0 aldrig få stöd, utan bara “misslyckas att förkastas”
  • Det underlättar för att tydligt kunna särskilja situationer där stickprovsresultatet inte ger stöd för någon av hypoteserna och situationer där H0 får stöd. Om man gör en nollhypotesprövning skulle båda dessa situationer ge ett icke statistiskt signfikant resultat
18
Q

Icke-parametrisk inferens

A

När vi har data på nominal- eller ordinalskala, dvs att medelvärde och standardavvikelse inte är meningsfulla mått och därför inte går att utnyttja,

eller: När vi har små stickprov med data som inte är normalfördelad

eller: När varianser skiljer sig stort mellan betingelser

Om man är osäker kan man testa både parametriska och icke-parametriska metoder för att se om resultaten skiljer sig.

19
Q

Fördelar icke-parametrisk inferens

A
  • Är i stort sett fria från restriktioner och kan nästan alltid användas. Ställer inte lika stora krav på data som parametrisk statistik
  • Är okänsligt för extremvärden i data
20
Q

Nackdel icke-parametrisk inferens

A

Mindre power (mindre kraftfulla) då de använder mindre information från data än vad parametriska metoder gör

21
Q

Chi^2

A

Ett icke-parametriskt inferenstest.

Är observerade frekvenser skilda från förväntade frekvenser?

Man jämför den fördelningsform man fick för sitt stickprov med den fördelningsform som slumpen skulle ge. Är fördelningsformen tillräckligt osannolik för att få av en slump förkastar man nollhypotesen.

Förutsättningar:
* Oberoende observationer
* Slumpmässigt stickprov
* Förväntade frekvenser bör vara >5
* Kan inte användas på relativa frekvenser (alltså inte %)

22
Q

Icke-parametriska inferenstest

A

Undersöka skillnader
* Wilcoxon signed-rank test - för inomgruppdesign
* Mann-Whitney - för mellangruppsdesign

Undersöka korrelationer
* Kendalls tau
* Spearmans p

23
Q

Wilcoxon signed-rank test

A

Icke-parametriskt test för en inomgruppsdesign, dvs två beroende stickprov.

Vi vill veta om stickprovets median skiljer sig från populationens median.

Skiljer sig medianerna åt mellan de olika betingelserna?

Behöver minst ordinalskala på BV

24
Q

Orsaker till replikationskris

A
  • Publikationsbias
  • Låg statistik power
  • P-value hacking. Att man gör många analyser men bara publicerar de som är signifikanta
  • HARKing. Hypothesizing After Results are Known. Att man gör post hoc-hypoteser som presenteras som a priori-hypoteser