Introföreläsning Flashcards
Parameter
En sammanfattande kvantitet (dvs en siffra) som beskriver populationen.
Statistika
En sammanfattande kvantitet (dvs en siffra) som beskriver stickprovet.
Vissa statistiska kan vara meningsfulla som estimatorer för populationen, ex. medelvärde, sd och varians.
Deskriptiv statistik
Sammanfattning av stickprovsdata med olika statistika.
Ex. medelvärde, median, standardavvikelse, formen på stickprovsfördelningen.
Inferentiell statistik
När vi använder stickprovsdata för att dra slutsatser om populationen. Dvs att vi gör en inferens.
“Är funnen effekt i stickprovet sann i populationen?”
Då behöver vi göra en hypotesprövning
Hypotesprövning
En hypotes är en kvalificerad gissning avseende någon kvantifierbar egenskap i populationen.
Nollhypotesen (H0): Det är ingen skillnad mellan två grupper/betingelser avseende någon beroendevariabel, alternativt att det inte är något samband mellan två variabler i populationen.
Alternativhypotesen (H1): Det är en skillnad alt. det finns ett samband.
Parametrisk statistik
När det är möjligt att estimera parametrar, d.v.s. populationsn medelvärde och standardavvikelse, utifrån stickprovet.
Förutsätter:
* att vi har data på kvot- eller intervallskala
* att stickprovet är normalfördelat om det är litet
* att vi har homogen varians
Normalfördelning
Viktig inom parametrisk statistik.
Avvikelser från normalfördelning:
* skewness
* kurtosis
Standardfelet
Avvikelsen mellan medelvärden, om vi hade upprepat testet på många stickprov
eller:
Standardfelet beskriver hur mycket stickprovsmedelvärdena kommer att variera kring populationsmedelvärdet.
Centrala gränsvärdessatsen
När stickprovet är tillräckligt stort kommer fördelningen över stickprovsmedelvärden närma sig normalfördelningen, oavsett hur stickprovets fördelning ser ut.
p-värdet
Sannolikheten för att få ett testresultat som är minst lika extremt som det erållna resultatet, givet att nollhypotesen är sann.
Ett litet p-värde anger att nollhypotesen är falsk alternativt att en osannolik händelse har inträffat.
Power
Sannolikheten att finna en sann effekt.
Power ökar med:
* Alpha-nivån
* Effektstorleken. Och effektstorleken kan ökas med ökad mätprecision
* Stickprovsstorlek
Effektstorlek/-styrka
Om vi vet att det finns en skillnad eller ett samband så vill vi veta hur stor skillnaden är eller hur starkt sambandet är. Då vill vi beräkna effektstorleken.
För vissa variabler är det lätt att tolka effektstorleken, ex vikt (en medicin som gör att man går ned 10 kg är bättre än en som gör att man går ned 1 kg). Sådana icke-standardiserade effektstorlekar är beroende av måttenheter (ex vikt).
Men för många variabler är det svårare att tolka effekten, och man vill därför använda en standardiserad effektstorlek. De är dessutom oberoende av måttenheter och kan därför bättre jämföras.
Större standardavvikelse ger en lägre standardiserad effektstorlek.
Effektstorlekar är alltid punktestimat och därför förknippade med osäkerhet
Cohens d
För skillnader mellan två medelvärden. Används alltså för effektstorlekar vid t-test.
0.2 = liten
0.5 = medium
0.8 = stor
Bayesiansk statistik
En inriktning inom inferentiell statistik, där man inte bara testar om resultatet är osannlikt givet nollhypotesen, utan även om resultat är sannolikt givet alternativhypotesen.
På så sätt kan man utvärdera om resultatet utgör evidens för den ena eller den andra av hypoteserna, eller kanske inte är evidens för NÅGON av hypoteserna.
Bayesiansk slutledning grundar sig i att den hypotes som bäst predicerade resultatet är den hypotes som får mest stöd av resultatet.
Bayesfaktorn
Sannolikheten för ett visst resultat givet en viss hypotes, dividerat med sannolikheten för ett visst resultat givet ett annan hypotes.
Är ett direkt mått på stödet FÖR eller MOT en statistisk hypotes, jämfört med p-värdet som bara används som evidens MOT nollhypotesen.
Bf är ett sätt att kvantifiera HUR mycket mer stöd alternativhypotesen får än nollhypotesen.
Ett högt värde på Bayesfaktorn indikerar ett starkt stöd för hypotesen i jämförelse med alternativet.
Bf < 1 = mer stöd åt H0 än H1
Bf > 1 = mer stöd åt H1 än H0
Bf = 1 = båda hypoteserna predicerade stickprovsresultatet lika väl