statistik 4: logistiska regressioner Flashcards
linjär vs logistiska/binormala regressioner
linjär: kontinuerliga variabler
logistiska: dikotom variabel
Generalized linear model
en generell modell för alla linjära samband, alla sorters regressioner kan föras ihop (linjära, logistiska etc).
Det bygger på att man vet fördelningen av den beroende variabeln Y (family/error) och att det finns en länk mellan x och y (log. loggit)
tolkning av variabler i en multivariabel analys
(exp(B)=OR
dikotoma variabel: koefficient ger OR för högsta kategorin jämfört med lägsta
kontinuerlig variabel: hur mycket OR ändras när variabeln ökar med en enhet
kategorisk variabel: anger OR för en kategori i relation till referenskategorin. Som dikotoma fast i flera kategorier
förutsättnningar för överlevnadsanalys
- slumpmässigt urval av pop
- individer måste vara oberoende av varandra
- tiden mäts till utfall upptår eller tills individer cencureras (inget utfall)
vad är överlevnadsanalys
besläktad till metoder som används vid kohorter, det är olika metoder för att ta hänsyn till hur tid påverkar utfalll
kaplan meier överlevnadsdtabell
används för att estimera överlevnadsfunktion av livstidsdata, t.ex. hur länge man överlever efter en behandling
- räknar med tiden för de som censurerats
- i tabellen följer man pat. från start-slut, man markerar när i tiden saker inträffar
jämförelse mellan överlevnadskurvor
Detta görs när överlevnadstabellen har översatts till en graf, 3 möjliga sätt
- gå in vid en tidpunkt och jämför kurvor där, händelser ses i form av hack (där den kumulativa överlevnaden sjunker) eller ett kors=censur
- chi-2 test
- kolla utfallet i slutet
Log rank test (variant Chi 2)
test för att se sig. skillnad mellan grupper om man har överlevnadsdata
- flera test finns som tar hänsyn till överlevnadstid och händelser. I med. statistik är log-rank test dominerande för att visa skillnad i överlevnadstid
log rank hypoteser
H0= kurvor är lika, ingen sig. skillnad mellan överlevnadsdatan
p anger om H0 är sann ja/nej
proportional hazard model= COX regression
regressionsmodell vid överlevnadsanalys
- kurvorna som ska användas antas ha samma fördelning
- Det man räknar på är:
sannolikhet att en händelse inträffar vid en viss tidpunkt om den inte har inträffat vid föregående tidpunkt - Rat över dödlighet räknas ut (dödsrat, risk) för varje grupp, sen kan man dividera rater för att få fram en hazard ratio. Hazard ratio tolkas som andra relativa risker (liknar en incidenskvot)
när används COX-regressioner
kohorter bl.a.
Hur tolka HR=1.35
HR=dödsrat
hazard ratio=ExpB. OBS att vid logistisk regression så tolkas ExpB istället som en odds ratio.
Skillnaden mellan grupperna ger en HR på 1.35, dvs 35% högre risk att dö om man har fettlever jämfört inte fettlever. OBS dock om p är sig. också!!
vilken kurva ska man använda för att visa skillnad i överlevnad mellan grupper
kaplan meier kurvorna
ett grundantagande i cox-reg är att kurvorna är mer eller mindre parallella med varandra, det innebär att sådana kurvor inte ska användas för att visa hur överlevnad ser ut mellan olika grupper
hur kan man titta på om modellen är sig. utan att kolla på p vid en COX-reg?
då KI inte överlappar 1 och hela intervallet av KI är på samma sida om 1 som hazard ratio föreligger signifikans
Beskriv HR 1.86
Hazard ratio eller relativ risk innebär att t.ex. rökare har 1.86 ökad risk att få ett visst utfall jämfört med icke-rökare