Biostatistik Flashcards
Vilka olika dataformat är vanliga?
Kontinuerliga, dikotoma/binära, kategoriska..
Kontinuerliga, tex kroppsvikt, puls, andningsfrekvens
Dikotoma= binära dvs 1/0, tex sjuk ja/nej,
Kategorisk: - låg, mellan, hög (rankat): lågt, normalt resphögt blodtryck- blå, röd, grön (ingen rankning): tex hundras Schäfer, Labrador, Pudel
Vad är skillnaden mellan beroende och oberoende observationer?
Beroende - Upprepande mätningar på samma individ. Ex. serie av blodtryckmätning på en hund.
Oberoende - Ex enstaka mätning på olika individer..
Vad kallas testet när man jämför medelvärdet mellan två grupper där observationerna är oberoende?
T-test/Student’s t-test
Obs - t-test förutsätter att observationerna är oberoende.
Vilket test använder man när man när två observationer är beroende/hänger ihop, ex data före och efter behandling?
Parat test/Paired test
Vilka test använder man om man vill jämföra proportioner - om både utfall och riskfaktor är 1/0?
Fisher’s exact test
eller
Chi2-test
Vilken typ av dataformat är följande variabler?
- Temperatur postop katt
- Katter som tillfrisknat eller inte?
- Åldergrupper nyfödda föl - 1-2 månad, 1-3 mån …etc
- Kontinuerlig
- Binär
- Kategorisk
Vilken är en vanlig förutsättning för statistiska test?
Oberoende observationer
När används student’s t-test respektive chi2-test?
T-test - Jämför två medelvärden mellan två grupper där observationerna är oberoende.
Chi2-test - Vid jämförelse proportion i två grupper om utfall och riskfaktor är 1/0. Fler observartioner.
Förklara normalfördelning.
Likformig kurva på båda sidorna av medelvärdet.
Orsakssamband:
Beroende variabel = ?
Oberoende variabel = ?
Beroende variabel - utfall
Oberoende variabel - riskfaktor/exponering
Om du tar fler sample/urval och dessa skiljer sig åt, vad kallas det?
Urvalsfel.
Vad är ett punkestimat/punktskattning?
Det är en estimering av något, den bästa skattningen av populationsvärdet. Ex. ett medle/medianvädre av observationer, riskratio.
Vad är konfidensintervall?
Visar den statistiska osäkerheten i uppskattningen, den statistiska felmarginalen. Visar det område där sanna populationsvärdet ligger. Vanligen 95%.
Vad påverkar konfidensintervallets bredd?
- Variation i populationen som man vill undersöka.
2. Urvalsstorlek
Vad sker om intervallet ändras från 95% till 99%?
Intervallet blir bredare.
Kan man använda konfidensintervall när man kollar på proportion?
Ja - detta gäller när variablerna är 1/0.
Hur stor är precisionen vid snävt kontra brett konfidensintervall?
Snävt ki: god precision
Brett ki: stor osäkerhet i det uppskattade estimatet
Vad ger det 95%iga konfidensintervallet?
Det intervall som med 95% säkerhet innehåller det sanna medelvärdet för populationen.
Vad visar ett konfidensintervall som inte ett punkestimat gör?
Ki visar bredden på intervallet.
Vilak två huvudsakliga mått används vid sjukdomsfrekvens?
Incidens
Prevalens
Beskriv incidens och prevalens.
Prevalens - De fall som finns precis nu i en grupp. - sjuka just nu. PRESENT
Incidens - Inflödet av nya fall av sjukdom. Alltid tidsram! - sjuka inom det här året
Vilka faktorer påverkar prevalensen?
- Kroniska/permanenta sjukdomar
- Sjukdomsduration
- Behandlingsbarhet
- Överlevnad
Hur påverkar sample-storleken konfidensintervallet?
Ju större sample, desto snävare intervall, dvs precisionen ökar.
När används p-värde?
För att visa statistik signifikans för undersökningen eller inte.
Var går den vanligaste gränsen för p-värdets signifikans?
0.05
Ge ett exempel på en nollhypotes?
Ex.
1. Det finns ingen skillnad mellan behandling A och benhandling B.
- Medelvikten är 100g
Vad berättar p-värdet om nollhypotesen?
P-värdet berättar hur troligt det är att nollhypotesen är sann –detta är p-värdet. Låga p-värden ger låg sannolikhet.
Vad säger ett lågt p-värde?
Ifall vi får ett lågt p-värde – ofta är gränsen 0.05 – så är det låg sannolikhet att nollhypotesen är sann.
Lågt p-värde ger att vi förkastar detta och säger att det är en statistiskt signifikant skillnad mellan behandling A och B.
Beskriv arbetsgången vid använding av p-värde.
- Förutsättning: signifikansnivån är p=0.05
- Formulera nollhypotes: Ho
- Samla in data -för att se om dessa data stöder nollhypotesen
- Statistiska beräkningar steg 1: först får man ofta fram tex medelvärden, proportioner, andra punktestimat som relativ risk: dessa skattade värden vill man komplettera med ett konfidensintervall, vanligen 95%
- Sedan görs ett statistiskt test som ger ett p-värde
- Baserat på p-värdet behåller eller förkastar vi vår nollhypotes
Kan konfidensintervall användas istället för p-värde? Om, ja, hur?
Ki visar intervallet där det sanna populationsvärdet ligger till, oftast, 95% sannolikhet. Man kan jämföra två ki: om inte överlappande ki så har man statistisk signifikans.
Vad kan påverka en studies chans att få ett lågt p- värde om det verkligen är skillnad?
Urvalsstorleken är viktig. Om man har fler observationer har man större styrka (power) att få statistisk signifikans om det föreligger en skillnad
Storleken på effekten är viktig dvs är det en större skillnad mellan A och B är den enklare att få statistisk styrka i testet
Vad är typ I-fel samt typ II-fel när vi pratar om nollhypoteser?
Typ I - Vi förkastar en sann nollhypotes
Typ II - Vi behåller en felaktig nollhypotes
En katt testar negativt fastän den har en sjukdom - vad kallas detta?
Falskt negativ
När är det viktigt att ha hög känslighet på testet, dvs ’alla’ som är sjuka fångas upp på testet?
1) Allvarlig men behandlingsbar sjukdom. Ex livmoderhalscancer på kvinnor.
2) För att utesluta sjukdom
3) När få i populationen som har sjukdomen testas och man vill hitta sjukdomen.
Specificitet, sensitivitet - vad innebär de båda?
Specificitet - Att de som är friska testar negativt.
Sensitivitet - Att de som är sjuka testar positivt.
De som testar positivt fast de är friska - vad kallas dessa?
Falskt positiva
När vill man ha hög specificitet?
1) Hög kostnad att felklassificera friska som sjuka
2) Bekräfta misstanke om sjukdom: testet ffa användbart om det är positivt
3) När hög andel i populationen som har sjukdomen testas och man vill utesluta sjukdomen
Vad innebär att ett test inte är fullkomligt?
- Att ni kommer få fel resultat ibland.
- Är det värre att missa några sjuka eller att råka få med friska i sjukgruppen?
- Beror på problemet.
Vad innebär gold standard?
Det test som anses vara den nuvarande bästa metoden för att diagnostisera en specifik sjuksdom. Alla nya test kommer att jämföras med detta.
Om vi ställer upp data i en korstabell, vilka ratio får vi ut från en fall-kontrollstudie respektive en kohort?
För en fall-kontrollstudiefår vi ut odds ratio(OR),
För en kohort får vi ut risk ratio(RR)=relativ risk
Definiera risk ratio
Risk att något händer i en grupp jämfört med risken att något händer i en annan grupp.
Definiera odds ratio.
Att ett utfall sker för exponerade jämfört med odds att utfallet sker för oexponerade
Korrelation
undersöker associationen mellan två eller fler variabler, ett mått på hur starkt sambandet är mellan två eller fler värden vilket mäts med en korrelationskoefficient
Tolkning av risk ratio:
1 =
>1 =
<1 =
1: ingen skillnad mellan grupperna
<1: lägre risk hos exponerade (om man jämfört expmot oexp)(skyddande) dvs exponeringen är förknippad med en lägre risk för sjukdom
> 1: högre risk hos exponerade (om man jämfört expmot oexp)
Vad leder confouding till om man inte tar hänsyn till det under analysen eller studieplaneringen?
Ökad varians i data
Introduktion av bias
Hur kan man minska effekten av confoundingunder studieplaneringsstadiet?
Randomiserad allokering
Begränsning
Matchning
Hur/när används regressionsanalys?
För att utvärdera flera variabler och confounders mot ett utfall
Nämn tre regressionsanalyser
kontinuerliga utfall -Linjär regression
Binära/ja-nej -Logistisk regression
Tid till händelse (död) –överlevnadsanalys
Förklara Standardavvikelse (SE)
Bruset/variationen/spridningen i data för stickprovet.
Förklara Medelfel (SD)
Hur säkert medelvärdet är skattat. Visar på hela målpopulationen.
Vad är inferens?
Vilken slutsats man kan dra till målpopulationen.
Om vi pratar om att minska effekten av confounding, vad innebär då stratifierat?
Exempelvis om man tror att kön är en confounding så kan man dela upp det i grupper, hanar och honor.
I en 2x2-tabell kan man räkna ut Risk Ratio, vilken är den vanligaste ekvationen för detta (under den här kursen alltså)?
a/(a+b) = RR