Logistisk regression Flashcards
Hvad er formålet med den logistiske regressionsanalyse?
At beskrive sammenhængen mellem en binær afhængig variabel (død) og en eller flere uafhængige variable (der både kan være kontinuerte, kategoriske eller binære).
Hvad er alfa-konstanten/interceptet?
Logitværdien for referencegruppen!
Hvad er beta-værdien?
Udtrykker logit-forskelle mellem forskellige værdier af de uafhængige variable.
Hvis man tager exp af disse så får man OR
Hvad er fordelen ved logistisk regression?
Man kan justere for mange mulige confoundere samtidig og risikere ikke at ende ud i en situation med for få person i hver strata.
Hvad er logits?
Logits er et sandsynlighedsparameter, ligesom odds eller p, det er bare sværere at fortolke… Beta-konstanterne er estimerede logit forskelle.
Hvad er Wald-testen?
Et mål for hvor langt væk man er fra nulhypotesen og dermed hvor sikker man er på sit resultat.
Hvad er formålet med linearitetstjekket?
Logistisk regression antager, at effekten af en kontinuert variabel er lineær, men det er ikke sikkert at den er det. Derfor vil vi gerne teste om variablen faktisk har en lineær effekt på udfaldet.
Hvorfor fjerner man de kubiske værdi først?
Man fjerner først det mest komplekse led. Det hierakiske princip!
Hvad hvis interessevariablen er insignifikant?
Man må aldrig tage interessevariablen ud modellen, også selvom den er insignifikant
Opskrivning af den endelige model
Formel:
- P = sandsynlighed
- Y= sandsynligheden for udfald
- X = den vilkårlige variable man justerer for:
- Som enten er interessegruppen = 1
- Eller referencegruppen = 0
- Streg = givet
- i = alle de kovariate man justerer for
- Alfa-konstant = baggrundsrisiko for referencegrupperne = risikoen for referencegruppen.
- Beta-værdierne = logit forskelle = exp(beta) = OR
Man kan ikke tolke direkte på en logit-værdi/forskel
Hvordan udregnes en kvadratisk effekt?
Man tager selve variablen i anden:
Blodtryksniveau2 =blodtryksniveau*blodtryksniveau
Hvordan udregnes en kontinuert variabels kvadratisk effekt på udfaldet?
Fx blodtryksniveaueffekt = a + (betasbp*sbp) + (betasbp2*sbp2)
Hvordan udregnes en kontinuert variabels kubiske effekt på udfaldet?
Fx BMI-effekt = a + (betaBMI*BMI) + (betaBMI2*BMI2)+(betaBMI3*BMI3)
Hvordan udregnes den kubiske effekt?
Man tager selve variablen i tredje:
BMI3 = BMI*BMI*BMI
Hvad er formålet med trin 3 i tretrinsraketten?
Vi kigger på om der er andre ting vi ikke tager hesyn til som fx interaktioner/effektmålsmodifikatorer.
Man skal have alle variable med igen, også selvom de var insignifikante i trin 1. Det kan jo godt være, at den insignifikante variabel ikke har en signifikant effekt på udfaldet, men det betyder ikke, at den ikke kan indgå i en signifikant interaktion med eksponeringen.
Dernæst udføres baglæns modelsøgning mhp. på få den med mættede model, som vi kan putte ind i den endelige logistiske regressionsformel