Föreläsning 1 - p-värde, bayesfaktorn, icke-parametrisk statistik Flashcards
Population
alla medlemmar i en viss kategori (ex. alla studenter vid UU)
Stickprov (sample)
En delmängd av populationen
Slumpmässigt stickprov
När slumpen avgör vilka som kommer tillhöra stickprovet (representativt urval)
Bekvämlighets-stickprov/urval
Välja ut deltagare utifrån deras tillgänglighet för forskaren
Populationsmedelvärde
Sanna medelvärdet för populationen
Hur förhåller sig populationsmedelvärdet och stickprovsmedelvärdet till varandra?
- Er urval av populationen kommer ha ett medelvärde som skiljer sig något från populationsmedelvärdet
- Medelvärdet för en mängd olika stickprover kommer vara normalfördelade med ett medelvärde nära populationsmedelvärdet
Parameter
En sammanfattande kvantitet (en siffra) som beskriver populationen - t.ex. medelvärde eller standardavvikelsen i en population
Statistika
En sammanfattande kvantitet (en siffra) som beskriver stickprovet
- Vissa statistika i stickprovet är meningsfulla estimatorer för populationen ex. medelvärde, standardavvikelse och varians
Deskriptiv statistik
Sammanfattning av stickprovsdata med hjälp av olika statistika (medelvärde, standardavvikelse, median osv)
Inferensstatistik
Användning av stickprovsdata för att dra slutsatser om populationen (göra en inferens)
- T.ex. hypotesprövning
Hypotesprövning
En kvalificerad gissning avs någon kvantifierbar egenskap i populationen. Används för att dra slutsatser om huruvida det man observerat i stickprovet också gäller för populationen eller om det är mer troligt att stickprovsresultatet beror på slumpen. För att göra detta formulerar man två motsatta hypoteser, nollhypotes och alternativhypotes.
Alternativhypotes (H1)
- Den hypotes man “tror på”
- Det finns en skillnad mellan grupper eller betingelser i populationen avs BV, alt det finns ett samband (en korrelation) mellan två variabler i populationen
Nollhypotes (H0)
- Motsatsen till alternativhypotesen
- Det finns ingen skillnad mellan två grupper eller betingelser avs någon BV, alt inget samband mellan två variabler i populationen
Parametrisk statistik (när används det och vad är förutsättningarna?)
- Används då det är möjligt att estimera parametrar, dvs populationens medelvärde och standardavvikelse från stickprovet (dvs om vi har data på kvot eller intervallskala)
- Förutsätter approximativ normalfördelning då stickprovet är litet
- Förutsätter lika varians mellan grupper (homogen varians)
Kvotskala
Svarsalternativen är rangordnade med specifika avstånd till varandra och det finns en given nollpunkt
Intervallskala
Svarsalternativen är rangordnade och har specifika avstånd till varandra men det finns ingen given nollpunkt
Rang/ordinalskala
Svarsalternativen är rangordnade men avstånden mellan svarsalternativen kan inte avgöras
Kategori/nominalskala
Svarsalternativen saknar rangordning, räkna antal i olika kategorier
Normalfördelningen
När det flesta mätvärdena ligger kring medelvärdet och fördelningen är symmetrisk kring medelvärdet, dvs att det finns lika många medelvärden över som under medelvärdet.
Normalfördelningen är helt definierad av medelvärdet och standardavvikelsen.
Negativ snedfördelning
- Har ett negativt skewnessvärde eller är snedfördelad åt vänster (lång svans åt vänster)
Positiv snedfördelning
- Har ett positivt skewnessvärde eller är snedfördelade åt höger (lång svans åt höger)
Positiv/låg kurtosis
- Leptokurtic
- Fördelning med hög topp där de flesta värdena ligger nära medelvärdet och väldigt få avviker