Biostatistik 2 Flashcards
Vad är slumpmässighet?
- Där ett utfall inte kan förutsägas utan följer en sannorlikhetsförordning
- Bygger på oberoende händelser eller mätningar och följer en fördelning
Vad är ett utfall?
- Refererar till det specifika resultatet av en slumpmässig händelse eller experiment
- Varje gång en slumpmässig process eller studie genomförs, observeras ett specifikt resultat (utfall), och detta kan vara ett av många
Olika typer av utfall?
- Kvantitativa utfall (kontinuerliga eller diskreta)
- Kvalitativa utfall /kategoriska
Vad är kvantitativa utfall?
- Kontinuerliga:
->Dessa utfall kan anta ett oändligt antal värden inom ett visst intervall - Diskreta:
-> Dessa utfall begränsas till ett bestämt antal möjliga värden
Vad är kvalitativa/ kategoriska utfall?
- Har ej ett numeriskt värde
- Inom olika skalnivåer
-> Rangårdnade
-> Ej rangordnade - Binära (dikotoma):
-> Två möjliga utfall (ex. ja/nej)
Vad är statistisk felmarginal?
- Osäkerhet i sitt datamaterial
- Den variation och osäkerhet som finns i resultaten från en statistisk analys och hur mycket vi kan lita på att de slutsatser vi drar från data faktiskt speglar verkligheten
- Det finns alltid en viss grad osäkerhet om hur väl resultaten speglar den verkliga populationen eftersom vi samlar data från ett urval
Vad är ett konfidensintervall?
- Ett statistiskt verktyg som ger oss ett spann av möjliga värden för en parameter, där vi med en viss konfidensnivå (95%) kan vara säkra på att det sanna värdet för populationen ligger inom detta intervall
- Representerar sannolikheten att intervallet kommer att innehålla det sanna värdet om vi upprepar mätningen många gånger
Varför är konfidensintervall så viktigt?
Osäkerhet i uppskattning:
- Konfidensintervall ger oss bättre förståelse för osäkerheten i våra resultat
- Istället för att bara ange ett punktestimat (ex. medelvärde), får vi också en uppfattning av variationen och den möjliga osäkerheten i våra resultat
Tydliga resultat:
- Genom ett intervall istället för ett ensklit värde kan vi kommunicera resultat på ett mer nyanserat sätt
- Om ett konfidensintervall för ett medelvärde inte inkluderar noll, kan vi dra slutsatsen att effekten är statistiskt signifikant
Vad är standardfel (SD)?
- Spridningen av stickprovets medelvärde kring det sanna populationens medelvärde
- Används för att beräkna konfidensintervall och p-värden och är en central komponent i många statistiska tester
Skillnad mellan standardavvikelse (SD) och standardfel (SE)?
SD:
- Variation i data
- Spridningsmått för att visa på den variation som finns i datamaterialet
- Skattning av variationen som också finns i den större målpopulationen
SE:
- Osäkerhet i ett uppskattat värde (ex. medelvärde)
- Beskriver precisionen av skattningen av populationsmedelvärdet
- ytterligare beskrivning av SD
Vad är ett referensintervall?
- Intervallet där majoriteten av friska individer förväntas hamna inom när vi gör en analys av en hälsomarkör (normalt, avvikelse=sjukdom/risk)
- Används ofta för bedömning av provsvar och diagnostik
- Vid en normalfördelning hamnar ca. 5% av populationen utanför referensintervallet
7 steg för arbetsgång för statistiska analyser?
1) Förutsättning: Signifikansnivå är P=0,05
2) Formulera nollhypotes: H0
3) Anta att H0 är sann i det här stadiet
4) Samla in data för att se om data stödjer H0
5) Statistiska beräkningar (medelvärde, KI)
6) Sedan görs ett statistiskt test som ger ett P-värde
7) Baserat på P-värdet behåller eller förkastar vi H0
Skillnaden mellan SD och KI?
SD:
- Mäter variationen i en datamängd
- Beskriver hur data varierar kring medelvärdet
- Beräknad direkt från data
KI:
- Ger ett intervall för en parameter i en population baserat på ett stickprov
- Beskriver osäkerheten i en uppskattning av en parameter
- Beräknas från ett stickprov och tar hänsyn till både variation i data och stickprovsstorlek
Vad är ett p-värde?
P-värde:
- Värde som avgör om ett observerat resultat är statistiskt relevant eller inte
- Ett mått på osäkerheten i hypotesprövningen
- Ett lågt P-värde (under 0,05) indikerar att det är osannolikt att resultatet beror på slumpen
- Ett högt P-värde tyder på större osäkerhet om resultatets statistiska signifikans
Vad är signifikansnivå (alfa)?
Signifikansnivå (alfa):
- Anger den maximala risken att felaktigt förkasta nollhypotesen när den faktiskt är sann (typ 1-fel)
Hur redovisar man P-värden?
- Enstjärnig signifikans (*)
-> P-värdet är mindre eller lika med 0,05 - Tvåstjärning signifikans (**)
-> P-värdet är mindre eller lika med 0,01 - Trestjärnig signifikans (***)
-> P-värdet är mindre eller lika med 0,001
Vad är hypotesprövning?
- En statistisk metod som används för att testa om en hypotes om en population är sann eller inte, baserat på ett urval av data
- Man använder data för att bedöma om det finns tillräckligt bevis för att stödja eller förkasta en specifik hypotes
Vad är en nollhypotes?
H0:
- Det antagandet vi testar mot
- Ofta att det inte finns någon effekt eller skillnad på ex. en behandling
Vad är en alternativhypotes?
H1:
- Det antagande vi vill visa
- Ofta att det finns effekt eller skillnad på ex. en behandling
Faktorer att ta hänsyn till valet av statistiskt test?
Typ av utfallsvariabel:
- Kvalitativ
- Kategorisk
Antal grupper:
- 1, 2 eller >2
Parametriska vs. icke parametriska test
Oberoende eller beroende observationer
När använder man ett parametriskt test?
- Om data är kontinuerlig
- Normalfördelning kan antas
- Homogenitet av varians kan antas
Exempel på parametriska test?
- t-test
- ANOVA
När använder man ett icke - parametriskt test?
- När data är ordinala eller inte normalfördelad
- När data innehåller outliers eller avvikelser från normalfördelningen
Exempel på icke-parametriska test?
- Mann-Whitney U-test
- Kruskal-Wallis test