statistik 1: allmänt och urvalsberäkning Flashcards
variabeltyper (kval, kvant)
kvalitativa - kategoriska, ej numeriska, t.ex. hur mår du?
Kvantitativa - numeriska, t.ex. ålder, längd
normalfördelning vs inte normalfördelad
mean SD
median kvartilavstånd (interquartile range)
SD
spridningsmått tillsammans med medelvärde, mått säger hur stor variation är bland individer för den mätta variabeln, måste dock behandlas med medelvärde för att få uppfattning om variationens storlek
snabbt sätt för att se om något är noramlfördelat
Om (SD>50% av medelvärdet) indikerar det på en snedfördelning, dvs på att vi inte har en normalfördelning.
Skewness är ett annat mått som kan användas (värde mellan -1 —> 1 är normalfördelat)
KI
med 95% säkerhet vet vi att pop. medelvärde ligger inom detta intervall. Man räknar ut det med studiens resultat
RI
95% av pop har ett värde inom detta intervall.
urvalsberäkning (poweranalys) - vad gör man
man räknar ut antal individer som behövs i en studie, viktigt då för få kan göra att man inte får fram resultat, men för stora studier kan bli dyrt etc
vilka parametrar ingår i urvalsberäkningen?
genomsnittsmådd (mean, proportion, SD)
power: anger sannolikhet att finna en differens om den existerar i just denna studie, dvs ett mått på hur pass bra man upptäcker skillnader om de finns. Man bestämmer själv sin power utifrån ekonomi och praktiska möjligheter.
p-värde: i första hand ett gränsvärde för om man ska tolka att statistiska analyser är signifikanta eller ej
mer om power
trolighet att korrekt identifiera en skillnad mellan grupper man studerar, om sådan finns
ideal är power >80%, dvs stor chans att identifiera skillnad mellan grupper
hur når man power?
- öka urval: studien får inte vara för liten
Stor sample ger smalare KI och mindre p-värde.
Resultat av för små studier är högre P-värde och vidare KI jämfört med en stor studie med risk för felaktiga slutsatser.
faktorer som påverkar urvalsberäkningen
alla 3 faktorer påverkar den slutliga urvalsstorleken, mål är att få tillräckligt stort urval för att försäkra att en effekt av förväntad storlek med tillräcklig trolighet kommer hittas
- p-värde: tillräckligt små värden ges om stort urval
- effekt: en liten effekt kräver ett större urval och vise versa. Man tittar på storleken på effekten, lätt att över/underestimera effekten dock…
- power: sannolikhet att hitta skillnad
hur kan man göra urvalsberäkningar?
nomogram
väster axis: Std difference
höger axis: power
Dra sträck mellan höger och vänster axis. Storlek på urval med p-värde 0,005 vs 0,001 har olika linjer. Samlple size kan utläsas