Grundläggande biostatistiska begrepp Flashcards
Statistik
Insamling, utvärdering, analys och presentation av data/information
Biostatistik
Tillämpning av statistik inom det biologiska området
Huvudgrupper av datavariabler
Kvantitativ data - numeriska värden.
Kvalitativ data - subgrupper eller indelningar av data som inte är numerisk i grunden
Varför behövs statistik?
- Kunna dra slutsatser från mindre population för att applicera för hela populationen med en viss procent säkerhet
- Undvika åsikter/tryckande som grund för beslut
- Hjälper till att beräkna hur mycket data du behöver samla in, samla aldrig in mer data än som behövs (etik)
- Hjälper till att förstå och tolka insamlad data
- Besvara forskningsfrågan, hypotesen
- Får belägg och grund för uttalande
Individ/Fall
Undersökningsobjekt
Population
Alla individer/fall som formar grupper som vill studeras
Urval
Strickprov, en spegling av populationen
Variabel
Faktor som studeras inom kvantitativ forskning
Totalundersökning
Alla i populationen undersöks
Interferensstatistik
Bygger på sannolikhet.
Drar slutsatser för en hel population utifrån studie gjord på ett urval av populationen.
Betyder att vi inte vet helt säkert och därför behöver beskriva grad av osäkerhet (p-värde)
Variabelnivåer
Nominalskala - klassificering
Ordinalskala - rangordning
Intervallskala - finns given ordning och differens, men ingen given nollpunkt
Kvotskala - finns given ordning, differens och absolut nollpunkt
Hypotesprövning
- Rimligheten i ett antagande (H0, finns ingen skillnad) prövas mot en alternativ hypotes/mothypotes (HI, finns skillnad)
- Vid den statistiska analysen testas normalt om nollhypotesen (H0) kan förkastas
- P-värdet ger “risken” att dra felaktiga slutsatser när H0 förkastas
Olika systematiska fel vid hypotesprövning
- Typ I-fel - Förkastar H0 fast den är sann, hittar en skillnad som inte finns. Regleras genom att höja signifikansnivån.
- Typ II-fel - H0 accepteras fastän den är falsk, missar en skillnad som faktiskt finns. Detta kan bero på stickprovsstorlek, effektstorlek och signifikansnivå
P-värde
Ett tal mellan 0-1 som anger hur sannolikt resultatet vi fått är, om nollhypotesen är sann. Vi behöver låga p-värden för att ha hög sannolikhet att kunna lita på resultatet
Felrisk
Felrisken som finns om det finns en skillnad mellan grupperna som beräknas genom p-värde. Är en typ av “säkerhetsnivå” dvs, hur säker kan jag vara på att det finns systematiska skillnader i mitt resultat?