Föreläsning 1 - Intro Flashcards

1
Q

Population

A

Alla medlemmar i en viss kategori

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Stickprov

A

en delmängd av populationen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Parameter

A

En sammanfattande kvantitet/en siffra som beskriver populationen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

statistika

A

en sammanfattande kvantitet/siffra som beskriver stickprovet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

deskriptiv statistik vs inferensstatistik

A

Deskriptiv statistik: sammanfattar stickprovsdata kortfattat med olika statistika. Ex. medelvärde, standardavvikelse, median etc.

Inferensstatistik: använder stickprovsdata för att dra slutsatser om populationen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hypotes

A

En kvalificerad gissning avseende någon kvantifierbar egenskap i populationen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

H0

A

Det är ingen skillnad mellan två grupper/betingelser avseende någon beroende variabel. Alternativt inget samband mellan två variabler i populationen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

H1

A

Det finns en skillnad mellan grupper/betingelser i populationen avseende beroende variabel. Alternativt det finns en korrelation mellan två variabler i populationen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Parametrisk statistik

A

Då det är möjligt att estimera parametrar, dvs populationens medelvärde och standardavvikelse från stickprovet. Förutsätter bland annat:
- Data på kvot eller intervallskala
- Ungefär normalfördelning (om små stickprov)
- Lika/homogen varians mellan grupper

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Skalnivåer

A
  1. Kvotskala: svarsalternativen är rangordnade med specifika avstånd till varandra och det finns en given nollpunkt.
  2. Intervallskala: svarsalternativen är rangordnade och har specifika avstånd till varandra, men det finns ingen given nollpunkt.
  3. Ordinalskala: svarsalternativen är rangordnade men avstånden mellan alternativen kan inte avgöras.
  4. Nominalskala: svarsalternativen saknar rangordning, räkna antal i olika kategorier.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Skewness

A

Sned fördelning. Skewness är ett mått som används för att beräkna hur sned fördelningen är i relation till normalfördelning.
- Skewness 0 = normalfördelning
- Negativ skewness = en fördelning med “svansen” åt vänster.
- Postitiv skewness = en fördelning med “svansen” åt höger.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Kurtosis

A

Kurvans “toppighet”.
- Kurtosis 0 = normalfördelning.
- Positiv kurtosis = toppigare fördelning än normalfördelningen.
- Negativ kurtosis = plattare fördelning än normalfördelningen. Eller då mittenvärdena har lägre frekvens än yttervärdena.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Standardfelet

A

Ett estimat av avvikelsen mellan medelvärden (om vi hade upprepat testet på många stickprov).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Centrala gränsvärdessatsen

A

Då stickprovsstorleken (antal stickprov) är tillräckligt stort kommer fördelningen av stickprovsmedelvärden närma sig normalfördelningen oavsett hur de enskilda stickprovens fördelningar ser ut. Även om populationen inte är normalfördelad.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

p-värde (Fishers signifikanstestning)

A

Sannolikheten att erhålla ett resultat som är minst så extremt som det faktiskt erhållna resultatet om H0 vore sann. P är en egenskap hos data.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Tolkning av litet p-värde

A

Antingen har en osannolik händelse inträffat eller så är H0 falsk. Ju mindre p-värde desto starkare evidens mot H0.

17
Q

Neyman & Pearsons hypotestestning

A

En frekventistisk metod. Använder H1 som motpol till H0. En dikotom metod för att välja mellan dessa, utifrån alfanivå.(Involverar inget P-värde?)

18
Q

Null hypothesis significance testing (NHST)

A

Idag används en hybrid av Fishers och Neyman-Pearsons modeller. Består av följande steg:
- Presentera p-värden som ett kontinuerligt index mot H0 enligt Fisher
- Tillämpa sedan en dikotom beslutsstrategi enligt Neyman-Pearson: behåll H0 om p > a, förkasta H0 om p< a.
- Om p-värdet är mindre än alfa-nivån har vi ett statistiskt signifikant resultat.
- Slutsats: H0 är sannolikt falsk och alternativhypotesen H1 är sannolikt sann.

19
Q

Power

A

Sannolikheten att finna en sann effekt. Ökar med:
- a-nivå (på bekostnad av andel typ I-fel.
- Effektstorleken
- Stickprovsstorleken

20
Q

Effektstorlek

A

Svarar på någon av frågorna:
“Hur stor är skillnaden?” alternativt “hur starkt är sambandet?”.

Ickestandardiserade effektstorlekar är beroende av måttenheter (ex. olika värden fås då avstånd mäts i cm eller meter).

Standardiserade effektstorlekar är oberoende av måttenheter (t.ex. skillnader mätt i standardavvikelser) och kan bättre jämföras.

21
Q

Tre standardiserade effektstorlekar och deras indikationer

A

Cohens d: för effektstorlek vid t-test.
o 0.2 = small
o 0.5 = medium
o 0.8 = large
Eta2: för skillnader eller interaktioner vid ANOVA
o 0.01 = small
o 0.06 = medium
o 0.14 = large
Pearson’s r: korrelationen mellan två variabler
o 0.1 = small
o 0.3 = medium
o 0.5 = large

22
Q

Frekventistisk tolkning av sannolikhet:

A

(Neyman & Pearson). Bygger på idén om objektiva sannolikheter. Definierar sannolikhet som frekvenser. Besvarar frågan: Hur stor andel av upprepade test skulle leda till fel slutsats?

23
Q

Bayesiansk tolkning av sannolikhet:

A

Bygger på idén om subjektiva sannolikheter. (FYLL PÅ)

24
Q

Bayes teorem

A

Beskriver ett optimalt sätt att dra slutsatser från osäker information, och betingade sannolikheter av typen:
- Vad är sannolikheten för A givet att B inträffat/är sann?

25
Q

Bayesfaktorn

A

Ett alternativ till p-värdet. Ger ett direkt mått på relativ evidens för H1, relativt H0. BF jämför sannolikheten för data under en hypotes med sannolikheten för data under en annan hypotes. Ett högt värde på BF indikerar starkt stöd för H1 i jämförelse med H0.

26
Q

Två skillnader mellan p-värde och BF:

A
  • BF har en direkt tolkning av kvoten mellan sannolikheter att erhålla resultatet givet de två hypoteserna, medan p-värdet inte har en enkel tolkning (är ett index mot H0)
  • BF kan variera mellan noll och ändlighet. P-värdet bara mellan noll och ett.
27
Q

BF kritik och försvar:

A

-Kritik:
- Vilar på en subjektiv grund (priors, dvs gissningar avseende hypotesers sannolikheter och fördelningar av effektstorlekar)
- Hur posterior odds ratio ska bestämmas mha BF beror på min gissning av prior odds ratio – blir subjektivt?
-Försvar:
- Även om olika forskare har olika priors avseende hypoteser bör dessa konvergera mot samma mål (posteriors) efter upprepade uppdateringar.

28
Q

Icke-parametrisk inferens:

A

Metoder för data som är på:
- Nominal- eller ordinalskala.
Eller:
- Vid små stickprov med ej normalfördelad data
- Då variansen skiljer sig mycket mellan betingelser.

29
Q

Födelar och nackdelar med icke-parametriska test

A

Fördelar:
- I stort sett alltid fria från restriktioner, kan nästan alltid användas
- Ex vid små stickprov med skeva fördelningar
- Okänsligt för extremvärden i data
Nackdelar:
- Mindre power

30
Q

Inferens från nominaldata:

A

Inferens via jämförelser mellan observerade och förväntade frekvenser. Exempelvis mha: Chi2, Fisher’s exakta test, Binominaltestet, odds ratio.

31
Q

Inferens från ordinaldata

A

Rangordna data och justera för ties (data med samma rang). Använder sig av median och kvartilavvikelser. Exempelvis mha: Wilcoxon sign rank test, Mann-Whitney, Spearman’s rho.

32
Q

Förklara replikationskrisen och dess orsaker

A

50% av resultat inom psykologisk forskning kan ej replikeras. Möjliga orsaker:
- Publikationsbias
- Låg statistisk power
- P-value hacking: många analyser genomförs men bara signifikanta publiceras. Tillämpning av flexibelt stickprov.
- HARKing (hypothesizing after results are known). Post hoc hypoteser presenteras som á priori hypoteser.

33
Q

Beta nivå

A

Sannolikheten att behålla en nollhypotes trots att den är falsk/missa en effakt som faktiskt finns. (Typ 2-fel) 1 - Beta = power.