Biostatistik Flashcards
Varför statistik?
- Beskriva data
- Testa t.ex. om två behandlingsmetoder skiljer sig åt (om skillnaden vi ser inte beror på slumpen).
Ex. se om det är rasskillnad mellan förekomst av Diabetes Mellitus hos katter.
Vilka dataformat är vanliga?
- Kontinuerlig data = kroppsvikt, puls, AF etc.
- Dikotoma data (binära) = 1/0, finns bara två variabler t.ex. ja/nej.
- Kategoriska data = rankat (låg-hög variabel) eller icke rankat (röd, grön, blå)
Vad betyder normalfördelning?
En teoretisk statistisk modell för hur en kvantitativ variabel (numerisk) skulle kunna variera mellan olika individer i en population. Likformig kurva på båda sidor runt medelvärdet.
De vanligaste statistiska testerna utgår från att observationerna är oberoende. Vad innebär oberoende observationer?
Begreppet (statistiskt, stokastiskt) oberoende observationer innebär att varje ny observation, varje ny data, ska ge lika mycket information oavsett alla tidigare observationer – de ska alltså inte ’hänga ihop’.
Ge exempel på observationer som INTE är oberoende (dvs ÄR beroende).
- Om man gör upprepade mätningar på samma individ. T.ex. blodtryck på samma hund flera gånger per dag.
- Hierarkiska data. Att man gör en blodtrycksmätning på på valpar från samma tik. (Man kan anta att dessa är mer lika än blodtrycksmätning på valpar från vitt skilda tikar.)
- Personpåverkan. Ibland kan personer som hanterar/samlar/analyserar prov förorsaka statistiskt beroende mellan observationer. Om så är fallet är två observationer från samma person mer lika än två prov i allmänhet.
Kontinuerlig data behöver inte vara normalfördelad. Det kan vara en olikformad kurva på båda sidor runt medelvärdet. Vad innebär det? Ge två exempel på snedfördelad data.
Snedfördelad data är datamaterial där medelvärde och median skiljer sig markant åt.
- Negativt skev (vänstersvans)
- Positivt skev (högersvans)
För att jämföra två oberoende gruppers medelvärde vid normalfördelning, kan man använda ett statistiskt test, vilket?
Student’s t-test eller t-test.
(Förutsätter observationen är oberoende, vilket brukar vara grundantagandet vid statistiska analyser).
För att jämföra två gruppers medelvärde vid snedfördelning (icke-normalfördelning), kan man använda statiska test, vilka?
T.ex. Mann Witney U test eller Wilcoxon Signed Rank test
Om två observationer hänger ihop (är beroende), t.ex. om man har data på före och efter behandling inom samma individ, kan man INTE använda Student’s t-test. Vilket test använder man istället?
Parat test.
t.ex. parat t-test
Om både utfall och riskfaktor (determinent) är 1/0 använder man istället andra test.
Ex: jämföra proportion tikar med inkontinens i två grupper - kastrerade respektive intakta.
Ge exempel på statistiska tester som är lämpliga här.
- Fisher’s exact test (för mindre datamängd)
- Chi-squaired test/chi2-test (större datamängd)
Temperatur postop på katt.
Vilken typ av variabel?
Kontinuerlig data
Katter som tillfrisknat eller inte, efter akut gastroenterit.
Vilken typ av data?
Binära (dikotoma) data, 1/0.
Åldersgrupper nyfödda föl: 0-1 mån, 1-3 mån, 3-6 mån, 6-12 mån.
Vilken typ av data?
Kategorisk, rankad data (yngre till äldre).
Vilken är en vanlig förutsättning för statistiska test?
Normalfördelning
När används Student’s t-test?
Normalfördelade oberoende kontinuerliga data.
När används chi-squaired test?
Jämföra proportioner mellan två grupper. Vid större datamängd.
Vad innebär medelvärde och hur beräknar man det?
Ett genomsnittsmått för kvantitativa variabler (numeriska).
Beräknas genom att summera samtliga observationer och dividerar med antalet.
(Kallas även aritmetiska medelvärdet)
Vad innebär medianvärde?
Ett genomsnittsmått som är mittvärdet för en variabel (dvs hälften av av alla variabelvärden är mindre eller lika med medianen).
Vad är standardavvikelse?
Mått på genomsnittlig avvikelse från medelvärdet.
Vad är en variabel?
En uppgift som kan variera mellan olika individer i en undersökning.
Vad innebär konfidensintervall?
Den statistiska felmarginalen.
Konfidensintervall tar inte hänsyn till systemiska fel, utan enbart den statistiska osäkerheten (det slumpmässiga felet.
Vad innebär proportion?
Andel
Vad är ett punktestimat?
Medelvärde, punktestimat. Kan vara medelvärde, median, eller beräkningar av odds ratio.
Vilket är huvudsyftet med att studera ett utval av individer?
Att kunna dra slutsatser om en verklig eller tänkt, imaginär population.
Vad är konfidensintervall?
Den statistiska felmarginalen.
Som alltid finns när man estimerar utfall från en urvalsgrupp till en målpopulation
Vad menas med att konfidensintervallet ligger på 95%?
Att det är 95% sannolikhet att alla variabler i en population kommer hamna i konfidensintervallet. 5% kommer avvika och hamna utanför på vardera sida normalfördelningen.
I praktiken innebär detta att av 20 stickprov, ur samma population, kommer 19 hamna inom konfidensintervallet.
Vilket konfidensintervall är mest precist, ett på 95% eller ett på 99%?
Ju högre procent (bredare kurva) desto säkrare. MEN ju högre procent desto MINDRE precist.
Vad påverkar konfidensintervallets bredd?
Variationen i populationen man vill undersöka samt urvalsstorleken. Vanligast är dock att man använder 95% CI.
Vad innebär incidens?
Vilka som insjuknar i en sjukdom under en viss tidsperiod.
Vad innebär prevalens?
Alla som är sjuka under en viss tidsperiod.
Vilka faktorer påverkar prevalensen?
Inflödet av nya sjukdomsfall Sjukdomsdurationen Ev. utflyttning Behandlingsbarhet Överlevnad
Vad är en korstabell (two-by-two table)?
Ett sätt att ställa upp data.
Om vi har en riskfaktor som är vår exponering (exponerad: ja/nej)
Om vi har en sjukdom (frisk/sjuk).