Statistik, p-värde och annat skit Flashcards
vad är det rätta begreppet för orsak-effekt
kausalitet
vad står PICO för
P = population
I = intervention
C = counter intervention
O = outcome
detta ska man kunna få reda på i en studie
Epidemologi
läran om sjukdomars utbredning i befolkning
Prevalence
sjukdomsförekomsten vid mättillfället. Hur många är sjuka när man mäter
Incidens
Antalet nyinsjuknande mellan mättillfällena
skillnaden mellan internt och externt bortfall
Intern: de som har tackat ja men där man ej får in all data. Ex svara ej på alla frågor. eller dött under studiens gång
Externt: de som kommit med i urvalet men som tackat nej.
Beroende variabeln
utfalls variabeln, det som kan påverkas och som man vill studera. Dessa är beroende av de oberoende variablerna
Oberoende variabeln
en eller flera variabler som påverkar utfallet
Typvärde
mest vanligt förkommande värdet i serien
är datan kvot eller intervall och symmetriskt fördelat, vilket spridningsmått ska väljas
medelvärde och standardavvikelse (SD)
är datan kvot eller intervall och osymmetriskt, vilket spridningsmått ska väljas
median och kvartil
vid ordinaldata, vilket spridningsmått
median och kvartil
vid nominal, vilket spridningsmått
procent och antal
vad är spridningsmått
hur data är fördelat kring central måttet
vad är en Box plot
ett sätt att presenter data
man gör en box på en linje som utförs min och maxvärde, boxen görs från q1-q3 och mellan dessa markerar man ut median
vad är en normalfördelning
en symmetrisk kurva där median och medelvärde är detsamma
-det är en typ av sannolikhets fördelning
-kurvan visar sannolikheten för att ha ett vist värde
statistisk inferens
har man ett urval från en population kan det hända att medelvärdet på urvalet skiljer sig från populationen
-det finns olika sätt att räkan ut ifall resultaten faktiskt stämmer på populationen
vad är standard error = SE
vid skattningar finns osäkerheter
ju fler deltagare man har i en studie desto mindre chans för SE
-SE är ett mått på osäkerheten i en punkt skattning
vad är punkt skattning
Handlar om att beskriva en population med hjälp av skattade värden från ett urval
ex. m + SD
vad är konfidensintervall
CI
- ett sätt att visa på det sanna värdet i populationen
-CI är ett värde som till viss del täcker det sanna värdet i populationen
– Vanligast att CI ligger på 95%
förklara hypotes prövning
(0-hypotes och mothypotes)
- Är det resultatet vi får från stickprovet sannolikt att vara samma i populationen eller beror det på slumpen
- Dvs, med vilken sannolikhet kan man utesluta att det vi ser i stickprovet/urvalet beror på slumpen?
- Hur stor sannolikhet är det att det man ser i urvalet också stämmer hos pop, ex efter ett urval av kvinnor och män såg man att män var i medelvärde 10 cm längre än kvinnor. Stämmer även detta i pop?
- För att få reda på detta sätter man upp 0-hypoteser som prövas i hypotesprövning = man utgår från att det man upptäckt inte stämmer (män är i genomsnitt INTE längre än kvinnor)
- Detta vill man kunna förkasta- för att kunna göra det måste man kunna motbevisa 0-hypotesen. 0-hypotesen gäller alltså tills mothypotesen stämmer.
- Mothypotesen är alltså motsatsen mot 0-hypotesen (män är faktiskt längre än kvinnor)
- 0-hypotes testas med en testfunktion (analysmetoden)
statistisk signifikans
- Ifall 0-hypotes stämmer, hur stor är sannolikhet att detta syns i urvalet
- denna sannolikhet anges med p-värde
Vad påvisar ett högt/lågt p-värde
- Ifall högt p-värde visar det att det är stor chans för att värdena vi fått i urvalet beror på
slumpen och därmed att 0-hypotesen stämmer - Ifall lågt p-värde beror resultatet inte slumpen och mothypotesen är den som stämmer
Signifikansnivå (alfa-nivå)
Detta är vad gränsen för p-värde ska ligga
- Gränsen för p-värde ska vara <0.05 – om det är denna så tror vi på mothypotesen, sannolikhet för att värdena skulle bero på slumpen är mycket liten