Epidemiologi och biostatistik Flashcards
Kausalitet
Orsakssamband
Förklara och ge exempel på beskrivande och förklarande studier.
Beskrivande (deskriptiv): syftet är att beskriva och kategorisera egenskaper = Fallrapporter, fallserier, surveys.
Förklarande: syftet är att testa hypoteser och förklara samband = Experimentella (kontrollerat försök, labstudie) eller observationsstudier (tvärsnitt, kohort, fallkontroll).
Har de olika studietyperna samma kraft att styrka orsakssamband?
Nej, studiedesign avgör. Observationsstudier har lägre styrka än experimentell. Studier där exponering säkert kommer före utfall har högre styrka.
Vad är en tvärsnittsstudie? För och nackdelar?
Mäter exponering och utfall samtidigt. Visar sjukdom som prevalens (%) hos en grupp vid ett visst tillfälle.
- går ej att bedöma orsakssammanhang mellan exponering och utfall, vet ej vad som kom först.
+ enkelt och billigt.
Vad är en kohort studie? För och nackdelar?
Börjar med sjukdomsfria individer. Följer över tid och ser vilka som utvecklar sjukdom.
+ kan etablera tidssamband. Starkast att påvisa orsakssamband av observationsstudierna.
- kostsamt, lång uppföljningstid, många individer, kan få problem med bortfall.
Vad är fall-kontroll? För och nackdelar?
Väljer individer med sjukdom samt en kontrollgrupp.
- svårt att välja kontrollgrupp (frisk men spegla exponeringen i population där sjukdom utvecklas). Kan ej uppskatta sjukdomsförekomst.
+ kan undersöka många exponeringsfaktorer. Passar för att undersöka ovanliga sjukdomar. Starkare än tvärsnitt att styrka orsakssamband.
vilka två mått på sjukdomsfrekvens har vi arbetat mest med?
Prevalens och incidens.
vad är det för skillnad på prevalens och incidens?
incidens: insjuknandefrekvens.
prevalens: andelen i en population som är sjuk vid ett visst tillfälle.
Ge exempel på observationsstudietyper.
kohort, tvärsnitt, fall-kontroll.
de experimentella studierna har högst förmåga att visa orsakssamband, varför då?
eftersom man kan påverka testobjekten och bestämma vilka riskfaktorer testobjekten ska utsättas för.
vad kallas det inom epidemiologin om man har en diagnosmetod som ger perfekt (dvs helt korrekt) testresultat eller som är så bra att det är mot den metod mot vilken man jämför alla andra (nya) testmetoder?
guldstandard. Det bästa testet som finns för en viss diagnos har så kallad guldstandard. Ofta är det testet för dyrt för att använda varje dag. Vi får kombinera andra tester för att uppnå bra resultat. Guldstandardtestet används som referens när vi utvärderar hur väl
andra tester fungerar.
vilken studiedesign använder man gärna om man vill studera riskfaktorer för en ovanlig sjukdom?
fall-kontroll studie.
vi har talat om hur bra eller mindre bra diagnostiska tester fungerar och hur troligt det är att en patient har en viss sjukdom om testet för sjukdomen är positivt.
a) vad kallas det värde som specificerar andelen av de testpositiva som faktiskt är sjuka?
b) ge ett exempel på en faktor som påverkar detta värde.
a) positivt prediktivt värde.
b) testets känslighet och specificitet, prevalensen av sjukdomen som studeras.
låt säga att man gör ett diagnostiskt test på en patient. Patienten är sjuk men testet ger inte det resultatet, dvs är negativt. Vad kallas resultatet?
falskt negativt
ge exempel på systematiska fel, så kallade bias, som kan finnas i en studie och som man bör fundera över innan man genomför en studie, dvs i planeringsstadiet.
confounding (förväxlingseffekt). observationsbias (informationsbias/missklassifikationsbias/measurment error). selektionsbias.
vad kallas det när man kan dra slutsats om målpopulationen baserat på urvalet?
representerbarhet
vi har konstaterat att man ofta är intresserad av att studera orsakssamband i studier, dvs kausalitet, och vi har arbetat med konceptet ”fylld paj” enligt Rothman. Vad kallas ”en fylld paj” med delorsaker, dvs så att sjukdom utlöses?
En full paj kallas tillräcklig orsak. Pajbitarna är delorsaker. Om en viss orsak alltid är med, kallas den nödvändig orsak
vi har talat om olika dataformat, till exempel när vi pratat om olika utfall och val av statistiska tester. Ge exempel på två vanliga dataformat.
- Kontinuerlig skala: medelvärde eller medianvärde för att beskriva ”mitten” av datapunkterna (centralmått).
- Kategoriska: grupperade, låg/medel/hög.
- Binära - 1/0, ja/nej, sjuk/frisk.
nämn två sätt att bedöma statistisk signifikans.
P-värde under gränsen (0,05 oftast) och ej överlappande konfidensintervall.
a) förklara vad ett konfidensintervall är.
b) vad händer med ett intervall när man går från 99% konfidensintervall till 95% konfidensintervall?
a) inom det intervallet där det sanna punktestimatet bör ligga för populationen.
b) Intervallet blir smalare då det täcker färre värden.
vilken är den vanligaste nivån som används för p-värdet för statistisk signifikans?
0,05
förklara skillnaden mellan oberoende och beroende observationer.
- oberoende: observationerna hör ej ihop med varandra
- beroende: kan tex vara om man undersöker hundar från samma kennel. Då kan dessa vara släkt med varandra och därför beroende.
vilket associtionsmått/sambandsmått brukar vi använda när vi följer en grupp och jämför risken hos exponerade med risken hos oexponerade?
relativ risk.
om man inte ser någon skillnad mellan de två grupperna som man jämför, vilket punktestimat har då associationsmåttet?
1
ange två faktorer som påverkar prevalensen av en sjukdom.
inflödet av nya fall. dödlighet.
Vilken studiedesign av observationsstudietyperna kan bäst förklara orsakssamband? Varför?
Kohort. Börjar med sjukdomsfria individer, kan sedan studera flera utfall. Följer över tid och ser vilka som utvecklar sjukdom, kan etablera tidssamband.
Vi har talat om olika orsakskriterier som man kan använda när man undersöker om det finns ett samband mellan en exponering och ett utfall (dvs Hills kriterier). Nämn två av dessa kriterier.
Exponeringen sker före utfallet. Dos- responssamband.
Vad kallas det när man kan dra slutsats om målpopulationen baserat på urvalet?
Extern validitet.
Ge exempel på systematiska fel som kan finnas i en studie och som man bör fundera över i planeringsstadiet.
Selektionsbias, urvalet är ej representativt. Recall bias (djurägaren har svårt att minnas). Confunding bias (sammanblandning). Observationsbias (informationsbias, missklassifikationsbias, measurment error).
Nämn två skäl till att en skillnad mellan två grupper inte är statistiskt signifikant.
Skillnaden finns inte i verkligheten. För få testindivider i förhållande till storleken på skillnad som ska påvisas.
Vad händer med ett intervall när man går från 95% konfidensintervall till 99% konfidensintervall?
Det blir bredare/mer omfattande/större.
Vilket statistiskt test är den vanligaste när man jämför två oberoende medelvärden?
student t-test
Vilken regressionsmodell undersöker faktorer som påverkar tiden till en händelse, dvs time to event?
cox
validitet
Inre validitet: Korrekt slutsats om den undersökta populationen (frånvaro av systematiska fel)
Yttre/extern validitet: Generaliserbarhet; undersökningsresultatens giltighet för andra
populationer än dem som har studerats.
Förklara vad en nollhypotes är.
Krävs när man vill undersöka riskfaktorer. Utgångsläget i en statistisk hypotesprövning. Ofta konservativt
formulerad: ingen skillnad mellan grupperna, ingen förändring över tiden etc.
olika typer av regressions modeller
linjär: utfallet är kontinuerligt, rak linje, t.ex. vikt, ålder.
logistisk: dikotoma utfall/binära (sjuk/frisk, ja/nej), ger korstabell.
cox: Time to event/överlevnadsanalys. Linjen trappas nedåt och visar när individ får utfallet, t.ex. tid till död från en viss tidpunkt, även tid till dräktighet, måste inte vara död/dåligt.
informationsfel
Systematiska fel som beror på felaktigheter i datainsamlingen i en undersökning.
Nämn några vanliga dataformat.
Kontinuerlig, dikotom/binär, kategorisk
Vad menas med utfall?
Utfallet är det man undersöker i studien.
student’s t-test
Normalfördelade data. Används för att jämföra medelvärde mellan två grupper där observationerna är oberoende.
parat t-test
Används när observationerna hänger ihop, tex data före/efter behandling av en individ.
chi-squared test (chi2-test)
Statistiska test som innebär att man jämför
observerade frekvenser med förväntade under den nollhypotes som specificerats. Ju mer de observerade frekvenserna avviker från de förväntade desto lägre p-värde ger testet. Kan användas för att testa samband mellan grupp och utfall i korstabeller. Fordrar mer exakt p-värdesberäkning för att resultatet ska bli giltigt i små undersökningar.
punktestimat
Ett punktestimat kan vara ett medelvärde från en testpopulation som ska representera en målpopulation. För att kunna applicera punktestimatet på målpopulationen anger vi ett konfidensintervall, inom vilket vi är 95 % säkra på att målpopulationens värde ligger.
konfidensintervall
statistisk felmarginal, beskriver hur stor den statistiska felmarginalen är i exempelvis ett uppskattat medelvärde eller en uppskattad andel.
faktorer som påverkar prevalensen
Inflödet av nya fall. Sjukdomsdurationen. Ev utflyttning. Behandlingsbarhet. Överlevnad.
Mann Whitneys test
Icke-parametrisk motsvarighet t-testet, används för att pröva hypoteser om skillnader i fördelningen mellan två oberoende grupper. Testet bygger på att utfallen rangordnas; stora skillnader i medelrang mellan grupperna tyder på att fördelningarna skiljer sig åt = lågt p-värde
sensitivitet
Sannolikheten att en sjuk patient klassas korrekt (får ett positivt testresultat) i ett diagnostiskt test.
specifitet
Sannolikheten att en frisk patient klassas korrekt (får ett negativt testresultat) i ett diagnostiskt test.
standardavvikelse
Mått på den genomsnittliga avvikelsen från medelvärdet.
median
lämpligt att använda när värdena inte är symmetriskt normalfördelade
medelvärde
passar bra till symmetriskt normalfördelade värden
förklara kvalitativa och kvantitativa variabler.
kvalitativa = saker som inte mäts i mängd, t.ex. känslor eller alternativ
Kvantitativa variabler = saker som kan mätas, t.ex. hur många, vikt, längd
När vill vi ha hög sensitivitet på testet, och
fånga upp alla sjuka?
Allvarlig men behandlingsbar sjukdom. Få som testas
När vill vi ha hög specificitet, och inte
diagnosticera friska i onödan?
kostsamma behandlingar
risk
Hur stor andel av de exponerade har blivit sjuka?
relativ risk
Hur många gånger risk är det att bli sjuk hos exponerade jämfört med oexponerade individer?
confounding
en sammanblandande variabel som kan få oss att tro att ett samband finns, fast det inte gör det
metaanalys
mätvärden från flera undersökningar kombineras i en analys
retrospektiv
analyserar data som redan finns, från händelser som redan hänt
prospektiv
studien görs framåt i tiden
sensitivitetsanalys
gör om analysen på en mindre del data för att se om vi får samma resultat igen
4 viktigaste punkterna för att ett samband ska vara sannolikt?
- exponering sker före utfall
- flera studier visar samma sak
- sambandet är rimligt
- dos-responssamband (ju mer exponering, desto mer utfall)
Två typer av fel finns kring nollhypoteser?
- förkasta en sann nollhypotes
- behålla en falsk nollhypotes
Vad leder confouding till om man inte tar hänsyn till
det under analysen eller studieplaneringen?
Ökad varians i data. Introduktion av bias.
Förklara vad regressionsanalys är för något.
Statistiska modeller som kan utvärdera flera variabler och confounders mot ett utfall.
epidemiologiska triaden består av..?
agens, värd, miljö.
prediktivt värde för ett positivt test?
sannolikheten att en individ med positivt testsvar verkligen är sjuk.
prediktivt värde för ett negativt test?
sannolikheten att en individ med negativt testsvar verkligen är frisk.
korrelation=?
undersöker associationen mellan två eller fler variabler,
ett mått på hur starkt sambandet är.
statistisk styrka = ?
En studies chans att få ett lågt p-värde om det
verkligen är skillnad mellan grupperna. Urvalsstorleken är viktig, fler individer ger större skillnader och ger enklare statistisk styrka.
Hur kan man minska effekten av confounding
under studieplaneringsstadiet?
Man kan göra stratifierade analyser eller justera för variabeln i analysen genom att inkludera den i
en regressionsmodell.