R - logistisk regresjon Flashcards
Hva er RR?
er et mål som sammenligner sannsynligheten for en bestemt hendelse, som en sykdom eller et utfall mellom to grupper.
det er sannsynligheten for hendelsen i eksponeringsgruppen delt på sannsynlighet for hendelse i kontroll gr.
Hva er OR?
det er et annet mål på assosiasjon som sammenligner oddsen for en hendelse i en gruppe med oddsen for samme hendelse i en annen gruppe.
sannsynligheten på at hendelsen skjer delt på at det ikke skjer.
Hva er forskjellen på OR og RR?
RR er mer direkte og angir en økning eller reduksjon i risiko.
OR er ikke direkte representering i risiko, men heller forholdet mellom to odds.
- ser tilbake i tid.
Hva er forskjellen på lineær regresjon og multippel lineær regresjon?
LINEÆR REGRESJON:
- kun 1 uavhengig variabel for å forutsi en avhengig variabel.
- prøver å finne en lineær sammenheng mellom de to variablene ved å tilpasse en rett linje til data.
formel:
Y = a+ bx + c.
Y = avhengig variabel
X = uavhengig variabel
a = intercept
b = helning
c = feilleddet
MLR:
- inkluderer to eller flere uavhengige variabler for å forutsi en avhengig variabel.
- prøver å finne en lineær sammenheng mellom den avhengige og flere uavhenggige variabler.
- er en utvidelse av enkel lineær regresjon som tillater mer kompleks analyse.
Hva indikerer svaret 1, større enn 1 og mindre enn 1 for RR og OR?
RR:
1 –> ingen forskjell i risiko mellom de to gruppene.
> 1 er høyere risiko i eksponeringsgruppen sammenlignet med kontroll gruppen.
<1 indikerer lavere risiko i eksponeringsgruppen.
OR:
1 –> oddsen for hendelsen er de samme i begge gruppene.
> 1 hendelsen er mer sannsynlig i eksponeringsgruppen
<1 hendelsen er mindre sannsynlig i eksponeringsgruppen.
Når brukes kji kvadrat test?
- bruker når begge variabler er kategoriske.
- vurderer om det er en signifikant assosiasjon mellom to kategoriske variabler.
Når bruke logistisk regresjon?
- når utfallsvariabel(avhengig variabel) er kategorisk og forklaringsvariabel(uavhengig) er enten kontinuerlig eller kategorisk.
- modell estimerer odds ratio og sannsynlighet for utfallet basert på forklaringsvariabel.
Hva er en T-TEST?
- kontinuerlig utfallsvariabel og kategorisk forklaringsvariabel med kun to kategorisker.
- brukes for å sammenligne gj.s av to grupper for å se om de er statistisk forskjellige fra hverandre.
Hva er MLR?
- MLR brukes når utffalsvariabel er kontinuerlig og forklaringsvariabel kan være en kombinasjon av kontinuerlig eller kategorisk.
- Den estimerer sammenheng mellom begge variablene og kan inkludere interaksjoner og ikke-lineære relasjoner.
Tegn på at modellen er dårlig?
- HØY AIC
- Høy OR.
- ekstreme outliners
- Lav R^2 og høy residua error.
Hva sier residual standard error?
Standard error representerer standardavviket til residualene.
LAV RSE: det er bedt siden den indikerer at modellens prediksjoner er tett på de faktiske.
HØY RSE betyr større spredning, og større feil i modellens prediksjoner.
Hva vil AIC si i en analyse?
Sier noe om modellens kvalitet.
Lav AIC indikerer at det er en bra modell. Dersom vi har lav AIC betyr det at modellen er bedre til å forklare variasjon i data.
Hva sier Deviance?
Det er et mål på hvor godt en modell passer dataen.
Lav deviance: det er det vi ønsker og indikerer en bedre tilpasning til data.
Hva sier Multiple R-squared oss?
Representerer andel av variansen i den avhengige variabelen som forklares av de uavhengige variablene i modellen. 0 indikerer at modell ikke forklarer noe varians, mens 1 betyr at modellen forklarer all varians. ‘
Hva sier F-statistisk verdi?
HØY F-statistikk indikerer at uavhengig variabel samlet sett gir en signifikant informasjon om variasjonen i avhengig variabel.
HØY VERDI ER BEST → En høy F-statistikk