Kvantitativ Metod Flashcards
Parameter
Sammanfattande kvantitet (en siffra) som beskriver populationen.
Statistiska (Statistic)
En sammanfattande kvantitet (siffra) som beskriver stickprovet.
Deskriptiv statistik
Beskrivning av stickprovsdata utifrån olika statistika. T.ex. medelvärde, standardavvikelse, formen på fördelning.
Inferensstatistik
Stickprovsdata används för att dra slutsatser om populationen. T.ex. hypotesprövning - gör en gissning utifrån stickprov.
Parametrisk statistik
Försök till att estimera parametrar, dvs populationens medelvärde och standardavvikelse utifrån ett stickprov.
Krav:
- Data på kvot eller intervallskala
- Normalfördelning vid mindre stickprov.
- Homogen varians
Skaltyper
Kvotskala - Lika avstånd, angiven nollpunkt
Intervallskala - Rangordnade med specifika avstånd, ingen given nollpunkt.
Ordinalskala - Rangordnade, avstånd kan ej avgöras
Nominalskala - Kategorisk indelning utan rangordning.
Snedfördelning (skewness)
—>
….*.
Negativ snedfördelning………. ……. Medelvärdet på stickprovet har försjkutits framåt/blivit större/Åt höger.
<—
.…….
Positiv snedfördelning. … *……. Medelvärdet på stickprovet har förskjutits bakåt/blivit mindre/åt vänster.
Kurtosis
Hur toppig fördelningen är.
Positiv kurtosis — Spetsig
Negativ kurtosis - Rund
Standardfel SE
Den estimerade avvikelsen för populationen. Avvikelsen mellan medelvärden (om vi hade upprepat testet på många stickprov).
Centrala gränsvärdessatsen
Även om populationen inte är normalfördelad kommer stickprovsfördelningen att bli det. När vi tar ut medelvärden från våra stickprov och fördelar dessa under en kurva kommer det att bli normalfördelat. Desto större stickprov —> desto mer normalfördelat
Spelar ingen roll om populationen är normalfördelad eller ej. Vi kan ändå beräkna inferentiell statistik.
Inferenstestning
Om vi antar att H0 är sant, vad är sannolikheten att erhålla ett resultat som är minst så osannolikt i fördelningen för H0? Om vårt resultat är högst osannolikt/extremt i fallet där vi antar att H0 är sant, kan vi förkasta H0 som hypotes eftersom vårt resultat (H1) inte passar in där.
Fishers signifikanstest
Introducerade P-värdet. Såg det som ett kontinuerligt index där ju lägre p-värde, desto starkare stöd MOT H0.
Neyman-Pearson
Frekventistisk utgångspunkt. Dikotomt där datan säger ja/nej. Involverar inget p-värde.
”We are inclined to think that as far as a
particular hypothesis is concerned, no
test based upon the theory of probability
can by itself provide any valuable
evidence of the truth or falsehood of that
hypothesis” Neyman & Pearson, 1933, p
291
NHST - Null hypothesis significance testing
Jämför mot alfanivå. Alfanivå är ett frekventistiskt mått på den förväntade frekvensen av typ 1-fel i det långa loppet. Om p-värdet är mindre än alfanivån har vi ett signifikant resultat.
Vanliga misstolkningar om P-värdet
Att p-värdet är:
Sannolikheten att erhålla resultatet om H0 vore sann jämför med den sanna definitionen:
(Sannolikheten att erhålla ett resultat som är minst så extremt som det faktiskt erhållna resultatet, om H0 vore sann)
Sannolikheten att H0 är sann
Ett mått på sannolikhet för framtida replikation
Power
Sannolikheten att finna en sann effekt. Power ökar med
- alfanivå (på bekostnad av typ 1 fel)
- Effektstorlek
- Stickprovsstorlek
Olika typer av inferenstest
T-test
Anova
Korrelationer
Effektstorlek
Hur stor är skillnaden, hur starkt är sambandet?
3 standardiserade effektstorlekar och tumregler för tolkning
Cohens d (t-test)
- 0,2; 0,5; 0,8
Eta2 (ANOVA)
- 0,01; 0,06; 0,14
Pearsons r (Korrelationer)
-0,1; 0,3; 0,5
Frekventiskt perspektiv (Neyman & pearson)
Objektiv sanning. P-värde, t-test etc ?
Hur stor andel av upprepade test skulle leda till fel stlutsats? En hypotes är antingen sann eller falsk. Detta går inte att avgöra utifrån ett test eller en studie.
Bayesian
Subjektiv sannolikhet. Utgår från det man vet. Vad är mest sannolikt H1 eller H0? Ej sant eller falskt, mer vad det lutar åt…
Bayes teorem
Ett optimalt sätt att dra slutsatser utifrån osäker information.