Biostatistik och epidemiologi Flashcards
Hur ska man göra studier?
Dra säkra slutsatser om orsaksamband. Studera populationer (i olika grupper på olika platser) –> upprepade mönster
Tvärsnittsstuder/cross sectional
Exakt vad som händer här och nu, mäter exponering + utfall samtidigt. sjukdom=prevalens % Vi ser inte vad som kommer först, exponering eller utfall, billiga studier
Kohert studier
Börjar med sjukdomsfria individer följer över tid–> vilka utvecklar sjukdom. Etablera tidssamband, studerar flera utfall. Kostsamma, tidskrävande, bortfall, påvisar orsakssamband
Varför studera epidemiologi?
- Beskriva hur sjukdom upträder i en population
- Skatta samband mellan exponering/utfall
Riskfaktorer epidemiologi?
- Infektiösa sjukdomar
- Icke infektiösa sjukdomar
- Miljöexponering
- Skador
Modell beräckna kausaliteter
- Tidsflöde. Kausala nät. Länkar faktorer. beskriva samband.
- Pajer. Bidragande, tillräcklig och nödvändiga orsaker. Hela pajen=sjukdom
Kausalitet
Orsakssamband, orsak–>utfall
Olika sätt att undersöka samband?
Beskrivande: berättar vad som har hänt, hur många fall, ej varför. tex. fallrapport, surveys mm
Förklarande: Börjar med beskrivande, sedan analyserar varför det händer. Testar olika hypoteser + förklarar samband. tex. experimentella studier, observationsstudier
Prevalens
Mått på sjukdomsförekomst. Hur många är sjuka? Mått på den totala sjukdomsbördan vid given tidpunkt. Anges i %, jämför de sjuka med hela populationen. Tvärsnittstudie. Prevalens = incidens x duration. Tidpunkt måste anges/definieras
Incidens
Mått på sjukdomsförekomst. Hur många blir sjuka? Antal händelser i definerad population i definerad tidsperiod. (sjukdom/symptom) sjukdomsfri grupp–> vilka blir sjuka? Kohortstudier
Vad innebär pyr?
Personriskår= person years at risk. Räknar ihop total antal år alla personer varit med då det kan finnas bortfall/tar in fler eftersom. Alla personer ej varit me lika länge i en studie.
Prevalens skilja om incidens är lika?
Prevalens beror på sjukdomsförloppet. Låg prevalens= dödlig sjukdom, individen kanske dör snart. Eller om sjukdomen kan botas med LM Hög prevalens= lever länge med sjukdomen
Faktorer som påverkar prevalens
Inflödet av nya fall
Sjukdomsdurationen
Behandlingsbarhet
Överlevnad
Samband exponering och utfall?
Baseras på frekvens av utfall mellan exponerande och icke exponerade grupper av individer. Associationsmått=mäter hur stort samband som finns mellan exponering och utfall.
Absolut risk?
Hur stor risk att få sjukdomen om exponeras? Incidens (exponerade) - incidens (ej exponerade)
Relativ risk?
Riskrat (RR) Relativ risk anger risken i en grupp, jämfört med risken i en annan grupp. Relativ risk beräknas helt enkelt genom kvoten mellan två absoluta riskmått.
Hur beräcknar man RR?
Incidens (exponerade) / Incidens (ej exponerade)
RR = 1 –> exponeringen inte har betydelse för utcekling av sjukdom
RR = >1 –> exponeringen påverkar utvecklandet av sjukdomen
RR = <1 exponeringen är skyddande
Validitet
hög validitet= få systematiska fel/bias
Vad händer med värden vid ett slumpmässigt fel?
Hyfsad normalfördelning, lite fel i precisionen
Vad händer med värden vid ett systematiskt fel?
Kan bli helt felaktigt värde
Minska effekten slumpmässiga fel?
Ta många prover, ökar precisionen av populationen sanna värde
När uppkommer systematiska fel?
Under planering, utförande eller analys–> felaktig uppskattning av hur exponering av en faktor påverkar sjukdomsfrekvensen i en population
Selektionsbias?
Felaktig selektion av individer till en studie, felkälla som beror på metod av datainsamling
Målpopulation?
Den population vi vill uttala oss om mja studiens resultat
Observationsbias?
Felaktig datainsamling exponeringsstatus/sjukdomsstatus
Confounders?
yttligare en variabel som påverkar x och y
Stickprov?
ett mindre urval ur en större grupp. –> kunna dra slutsatser om hela gruppen utgående från de exemplar man analyserar. minimera urvalsfel och maximera noggrannheten
Minimera selektionsbias?
Representiv studiepopulation
Slumpmässigt urval
Hög svarsfrekvens bland deltagare
Lågt bortfall bland deltagare
Recall bias?
man kommer bättre ihåg händelser efter sjukdomen inträffat
Minimera observationsbias?
Blindad uppskattning av exponering + utfall
Använda repeterbara + relevanta metoder
Använda komplett + detaljerad information
Objektiva mätningar
Lär känna möjliga felkällor
Tydlig metoddel
Intern validitet?
Frånvaro av systematiska fel–>korrekt slutsats om den undersöka populationen
Extern validitet?
När man kan dra slutsatser om målpopulationen baserat på resultatet för urvalspopulationen. Måste först ha intern validitet
Diagnostiska tester?
- Anames + klinisk undersökning
- Andra faktorer räknas in tex kön, ras, plats mm
- Differentialdiagnoser
- Viktigaste testet först
- Sammanställ fynd
- Diagnos
Påverka diagnostiska tester?
Sjukdom oklar definition, kvalite på mätinstrumen
Sensitivitet (Se) vid ett test?
Andelen av de sjuka som testast positivt
(sant positiva / sant positiva + falskt negativa)
Specificiteten (Sp) vid ett test?
Andelen av de friska som testar negativt
(sant negativa / sant negativa + falskt positiva)
Vad är prediktivt värde av positivt test (PVPT)?
Andelen individer som testar positivt som har sjukdomen
Vad är prediktivt värde av negativt test (PVNT)?
Andelen individer som testar negativt som är friska
Vad menas med att PVPT ändras med prevalensen?
Om en sjukdom är vanlig i den populationen där testet används blir PVPT högre. Högre prevalens=högre PVPT
Varför statestik?
Viktigt att hantera information–>dra korrekta slutsatser. strukturera, jämföra info
Kvantitativ dataformat
Ger siffror för att bevisa de generella slutsatserna
Diskret: ofta heltalsvärden tex antal tänder
Kontinuerlig: Detaljnivå, små intervall många möjliga värden tex kroppsvikt
Kvalitativ dataformat
Ger detaljer och djup för att förstå konsekvenserna fullt ut.
Dikotom: Binära ja/nej
Kategorisk: rankat tex lågt-normalt-högt blodtryck orankat tex blå-grön-brun ögonfärg
Vilka diagram passar till kvantitativa variabler?
Histogram, stolpdiagram, linjediagram
Observationsstudier
Observerar, mäter, samlar in data, ingriper inte, inga aktiva handlingar för att påverka utfall
i. Tvärsnitt/cross-sectional,
ii. Fall-kontroll samt
iii. Kohortstudier, retrospektiva eller prospektiva
Histogram?
Kontinuerliga variabler/diskreta med många värden
Stolpdiagram?
Diskret variabel begränsat antal värden
Linjediagram?
Föränding över en tid (månader år)
Vilka diagram passar bäst till kvalitativa variabler?
Cirkeldiagram, stapeldiagram, stolpdiagram, linjediagram
Spridningsmått?
sammanfattande mått på utspridningen av observerade data/ sannolikhetsfördelning
Standardavikelse (SD)?
spridningsmått på hur de olika värdena för en population avviker från medelvärdet. Innehåller 95% av svaren (tar bort 2.5% högsta + lägsta värden) symmetrisk data
Kvartilavstånd?
Spridningsmått baserat på medianvärde. Visar på spretigheten i data då olika resultat kan ha samma median och medelvärde trots olika spridning. (asymmetrisk data)
Median istället för medelvärde?
Om datan ej är symmetrisk
Symmetrisk data?
Se det grafiskt, medial + medelvärde samma
Oberoende observationer?
Vanliga statistiska tester utgår från oberoende observationer. Alla datapunkter tillför lika mycket
Beroende observationer?
Observationer hänger ihop på olika sätt. Data hör ihop med varandra.
Positiv snedfördelning?
Medelvärdet blir högre än medianen
Negativ snedfördelning
Medelvärdet längre än medianen
Punktestimat?
Det är en estimering av något, den bästa skattningen av populationsvärdet. Ex. ett medle/medianvädre av observationer, riskratio.
Konfidensintervall
Visar område, med viss sannolikhet, det sanna populationsvärdet ligger. Ligger ofta på 95%, beräknar statistiska felmarginalen
Standardfel (SE) ?
Osäkerheten i en punktskattning, spridningsmått på hur medelvärden avviker från den sanna populationsmedelvärdet.
Används för att dra slutsatser på målpopulationen
Nollhypotes?
En hypotes som säger att det inte finns något samband mellan två variabler. Utgår från att nollhypotesen är sann tills data ger oss evidens
P-värde?
Sannolikhetsvärde, anger hur sannolikt det är att erhålla det observerade utfallet om nollhypotes är sann. Räcknar ut sannolikheten för att skillnaden skulle kunna ske av slumpen. Låga P-värden=låg sannolikhet (längre än 0,05 –> statistiskt signifikant= förkasta nollhypotes)
Hur ser arbetsgången ut?
- Formulera hypotes
- Formulera nollhypotes
- Anta att nollhypotesen är sann
- Samla in data för att se om det stödjer nollhypotesen
- Statistiska beräckningar, medelvärden, proportioner (komplettera dessa värden med ett konfidensintervall helst 95%)
- Statistiskt test P-värde
- Baserat på P-värdet behåller eller förkastar vi nollhypotesen
Vad kan påverka lågt p-värde i en studie om det finns skillnad?
Stort urval
Storlek på effekt (större skillnad mellan grupperna–> lättare att få statistisk signifikans)
Odds ratio (OR)?
Odds att ett utfall sker för exponerade jämfört med oexponerade. Hur en variabel föråller sig till en annan variabel. Oberoende av varandra om OR=1
>1= exponering riskfaktor
<1=exponering skyddande faktor
OR= (A/B) / (C/D)
Obundet slumpmässigt urval
Alla individer samma chans bli valda för undersökning.
Systematiskt slumpmässigt urval
Vi drar ett slumpmässigt tal för den första personen som delta via en dator avgöra på vilket nummer vi börjar
Stratifierat urval
Dela upp populationen i grupper efter till ex kön, ålder etc, och sedan dra slumpmässigt urval ur vardera grupp - strata.
Konfidensintervallet beskriver just detta
En studies precision, dvs hur stort det slumpmässiga felet är. 95 % KI innebär att det är 95 % sannolikhet att det sanna värdet ligger inom intervallet.
Högt konfidensintervall innebär alltså att studiens data är mycket spridda och att precisionen är låg – det slumpmässigt felet är stort.
SENSITIVTETEN, (Se)
Se hos ett test: hur stor andel av de patienter som är SJUKA som testet faktiskt fångar upp som testpositiva. Sannolikhet att testet korrekt identifierar individer som är sjuka.
Se = A / (A+C)
SPECIFICITET, (Sp)
Sp hos ett test: hur stor andel av de patienter som är FRISKA som testet faktiskt fångar upp som testnegativa. Sannolikhet att testet korrekt identifierar individer som är friska.
Sp= D / (B+D)
PVPT (predektivt värde positivt test)
hur stor sannolikheten är att de som testar positivt är sjuka. hur stor andel av alla som testar positivt som faktiskt är sjuka, dvs sant positiva. antal sant positiva dividerat med alla testpositiva (dvs sant positiva + falskt positiva).
PVNT (predektivt värde negativt test)
hur stor sannolikheten är att de som testar negativt faktiskt är friska. hur stor andel av alla som testar negativt som faktiskt är friska, dvs sant negativa. Detta fås genom att ta antal sant negativa dividerat med alla testnegativa (dvs sant negativa + falskt negativa).
Vilka olika typer av bias (systematiska fel) finns och vad innebär dem?
● Selektionsbias - felaktig selektion av individer till en studie
● Observationsbias - felaktig datainsamling beträffande exponeringsstatus eller sjukdomsstatus
● Confounders - ytterligare en variabel påverkar X och Y
Vilka olika typer av selektionsmetoder för stickprovet finns?
● Slumpmässigt urval - mest önskvärd, alla individer har samma chans, dator slumpar
● Icke slumpmässigt urval - bekvämlighetsurval
● Systematiskt urval - alla ska ha samma chans, man väljer t.ex. var fjärde individ, sen slumpas siffra mellan 1-10
● Stratifierat urval - delar upp efter t.ex. ålder, ras, kön, viktigt att ta hänsyn till gruppernas andel