Biostatistik Flashcards
Varför behövs biostatistik?
siffrorna hjälper oss att förstå information och undvika att vi drar slutsatser som är osannolikt att de är korrekta.
- det är ett redskap för att få ny kunskap.
Vad är en variabel?
en egenskap vi studerar/mäter
Vad kallas en egenskap vi studerar/mäter?
variabel
Vilken typ av information ger kvalitativ data?
Kvalitativa data samlar in information som beskriver ett ämne snarare än mäter det.
- ex. klassificering av tex. pälsfärg och upplevt hälsotillstånd
Vilken typ av information ger kvantitativ data?
Kvantitativ data samlar in information som kan mätas.
- ex. längd, vikt, blodsockernivå.
Vilka 4 olika dataformat finns det?
- Diskret variabel
- Kontinuerliga
- Dikotoma = binära
- kategorisk
Vad är speciellt med diskret variabel?
Den är kvantitativ men antar bara vissa (ofta heltals) värden.
- Tex antal personer i en familj, antal mjölktänder
Vad är speciellt med kontinueliga dataformat?
Kontinuerliga variabler kan anta vilket värde som helst, exempelvis blodtryck eller blodsockernivån.
Vad är speciellt med dikotoma/binära dataformat?
har två möjliga utfall
- finns ex enbart ja eller nej som svar.
Vad är speciellt med kategorisk data?
Kategorisk data, som kan anta ett fåtal olika värden, som t. ex. hög/medium/låg eller röd/grön/blå
- finns alltså olika grupper.
kan kontinuerliga variabler byta dataformat?
- ja, det kan vara fördelaktigt. T.ex. om blodtryck brukade vara binärt (högt eller lågt) kan det istället göras om till kategoriskt (lågt-normalt-högt).
Hur kan data beskrivas/visas?
- tabeller
- diagram
Vad definierar tabeller?
- data sorteras i tabeller
- två eller flera variabler samverkar
Vilka typer av diagram finns det?
- stolpdiagram
- histogram
- cirkeldiagram
- stapeldiagram
Vilken typ av data är lämplig att presentera i ett stolpdiagram?
diskret variabel med begränsat antal värden: visar frekvens (bar chart)
Vilken typ av data är lämplig att presentera i ett histogram?
Kontinuerliga variabler eller diskreta med många värden
Vilken typ av data är lämplig att presentera i ett cirkeldiagram?
Kvalitativa variabler: ytan proportionell mot andelen (pie chart)
Vilken typ av data är lämplig att presentera i ett stapeldiagram (med grupperade staplar)?
kvalitativa variabler: samma princip som cirkeldiagrammet (bar chart)
Varför vill vi presentera data?
- vi får enskilda variabelvärden i vårt urval av tex patienter
- vi behöver summera dessa värden
- genomsnittsvärden; medelvärde, median
- Symmetrisk fördelning: medelvärde och median lika
- Icke- symmetrisk fördelning: medelvärde och median inte lika.
- Förutom genomsnittsvärdet rapporterar man spridningsmått dvs hur mycket data varierar dvs sprider sig.
Vad är standardavvikelse (standard deviation = SD)?
- för de flesta material ligger de flesta värdena inom intervallet medelvärdet +/- 2 standardavvikelser.
- Detta innebär att det gör att den nedre gränsen blir medelvärdet - (2 x SD), och den övre gränsen = medelvärdet + (2 x SD). De i undersökningen var alltså mellan övre och undre standardavvikelsen.
Vad är kvartilavstånd (på engelska interquartile range)?
- för median används oftast 25e och 75e percentilen av data som spridningsmått runt medelvärdet.
- skillnaden mellan de övre och den nedre kvartilen kallas för kvartilavståndet. Detta motsvarar variationsbredden för de 50 % av värdena som befinner sig i mitten av serien av observationsvärden. Därigenom är kvartilavståndet ett mått på hur stor spridningen är i närheten av medianen.
Vad är viktigt att tänka på när man ska beskriva data?
tänk på att medelvärden ska vara meningsfullt!
Varför är medelvärdet meningsfullt med medelvärdet när data beskrivs?
- Om det är 2 grupper som gör att medelvärdet blir ett tal mellan grupperna som egentligen inte existerar så kan det vara bättre att dela upp grupperna och ge dem ett varsitt medelvärde.
- Ex. i diagrammet blev sammantaget av gruppen 2 vilken ingen katt visade → missvisande medelvärde. Här kan vi se att det är lämpligare att dela in dessa i 2 olika grupper.
Vad styr vilken testmetod du kan använda vid statistiskt test?
utfallet
Vad är ”utfallet”?
- Utfallet är det man undersöker i studien, tex kroppsvikt hos labradorer, och det kan vara en sjukdom (som diabetes hos katt) eller något positivt (som hur ofta någon är glad eller skriver godkänt på en tenta), eller annan negativ händelse (som död).
- Notera att den variabel som kallas utfallet i en undersökning inte behöver vara ett utfall i andra undersökningar.
Vad innebär en kontinuerlig skala inom statistiska test?
Medelvärde eller medianvärde för att beskriva “mitten” av datapunkterna, dvs centralmått. Ex: jämföra medelblodtryck för människor som får olika behandling.
Vad innebär en 1/0 - variabel inom statistiska test?
proportion eller räknar antalet händelser.
- Ex jämföra proportionen katter som blir symtomfria av gastroenterit Behandling.
Vad innebär grupper/kategorier inom statistiska test?
Antal eller proportion i varje grupp.
Vilka typer av observationer utgår de vanligaste statistiska testerna ifrån?
oberoende observationer
Vad menas med oberoende observation?
Begreppet (statistiskt, stokastiskt) oberoende observationer innebär att varje ny observation, varje ny data, ska ge lika mycket information oavsett alla tidigare observationer – de ska alltså inte ’hänga ihop’.