R - logistisk regresjon Flashcards
Hva er RR?
er et mål som sammenligner sannsynligheten for en bestemt hendelse, som en sykdom eller et utfall mellom to grupper.
det er sannsynligheten for hendelsen i eksponeringsgruppen delt på sannsynlighet for hendelse i kontroll gr.
Hva er OR?
det er et annet mål på assosiasjon som sammenligner oddsen for en hendelse i en gruppe med oddsen for samme hendelse i en annen gruppe.
sannsynligheten på at hendelsen skjer delt på at det ikke skjer.
Hva er forskjellen på OR og RR?
RR er mer direkte og angir en økning eller reduksjon i risiko.
OR er ikke direkte representering i risiko, men heller forholdet mellom to odds.
- ser tilbake i tid.
Hva er forskjellen på lineær regresjon og multippel lineær regresjon?
LINEÆR REGRESJON:
- kun 1 uavhengig variabel for å forutsi en avhengig variabel.
- prøver å finne en lineær sammenheng mellom de to variablene ved å tilpasse en rett linje til data.
formel:
Y = a+ bx + c.
Y = avhengig variabel
X = uavhengig variabel
a = intercept
b = helning
c = feilleddet
MLR:
- inkluderer to eller flere uavhengige variabler for å forutsi en avhengig variabel.
- prøver å finne en lineær sammenheng mellom den avhengige og flere uavhenggige variabler.
- er en utvidelse av enkel lineær regresjon som tillater mer kompleks analyse.
Hva indikerer svaret 1, større enn 1 og mindre enn 1 for RR og OR?
RR:
1 –> ingen forskjell i risiko mellom de to gruppene.
> 1 er høyere risiko i eksponeringsgruppen sammenlignet med kontroll gruppen.
<1 indikerer lavere risiko i eksponeringsgruppen.
OR:
1 –> oddsen for hendelsen er de samme i begge gruppene.
> 1 hendelsen er mer sannsynlig i eksponeringsgruppen
<1 hendelsen er mindre sannsynlig i eksponeringsgruppen.
Når brukes kji kvadrat test?
- bruker når begge variabler er kategoriske.
- vurderer om det er en signifikant assosiasjon mellom to kategoriske variabler.
Når bruke logistisk regresjon?
- når utfallsvariabel(avhengig variabel) er kategorisk og forklaringsvariabel(uavhengig) er enten kontinuerlig eller kategorisk.
- modell estimerer odds ratio og sannsynlighet for utfallet basert på forklaringsvariabel.
Hva er en T-TEST?
- kontinuerlig utfallsvariabel og kategorisk forklaringsvariabel med kun to kategorisker.
- brukes for å sammenligne gj.s av to grupper for å se om de er statistisk forskjellige fra hverandre.
Hva er MLR?
- MLR brukes når utffalsvariabel er kontinuerlig og forklaringsvariabel kan være en kombinasjon av kontinuerlig eller kategorisk.
- Den estimerer sammenheng mellom begge variablene og kan inkludere interaksjoner og ikke-lineære relasjoner.
Tegn på at modellen er dårlig?
- HØY AIC
- Høy OR.
- ekstreme outliners
- Lav R^2 og høy residua error.
Hva sier residual standard error?
Standard error representerer standardavviket til residualene.
LAV RSE: det er bedt siden den indikerer at modellens prediksjoner er tett på de faktiske.
HØY RSE betyr større spredning, og større feil i modellens prediksjoner.
Hva vil AIC si i en analyse?
Sier noe om modellens kvalitet.
Lav AIC indikerer at det er en bra modell. Dersom vi har lav AIC betyr det at modellen er bedre til å forklare variasjon i data.
Hva sier Deviance?
Det er et mål på hvor godt en modell passer dataen.
Lav deviance: det er det vi ønsker og indikerer en bedre tilpasning til data.
Hva sier Multiple R-squared oss?
Representerer andel av variansen i den avhengige variabelen som forklares av de uavhengige variablene i modellen. 0 indikerer at modell ikke forklarer noe varians, mens 1 betyr at modellen forklarer all varians. ‘
Hva sier F-statistisk verdi?
HØY F-statistikk indikerer at uavhengig variabel samlet sett gir en signifikant informasjon om variasjonen i avhengig variabel.
HØY VERDI ER BEST → En høy F-statistikk
P-verdi?
En lav p-verdi, under 0,05 oftest, indikerer at det er lite sannsynlig at modellens resultat er tilfeldig, og at det er en statistisk signifikant sammenheng mellom de uavhengige og avhengige variablene.
Hva er individuell feilrate(individual error rate)?
Sannsynligheten for at en eller flere tester feilaktig konkluderer at den observerte forskjellen er statistisk signifikant.
Hva gjør bonferropni korreksjon?
Er en statistisk justering som brukes for å kontrollere for økning av type 1 feil som oppstår når flere hypoteser testes samtidig.
Deler valgt signifikansnivå med antall tester.
Utfordringer ved bonferroni?
- kan være konservativ og redusere statistiske styrken. Så ting kan overses fordi signifikansnivå er lavt.
- forutsetter at alle tester er uavhengige hverandre, og i praksis kan tester være korrelerte.
- sannsynlighet for type 2 feil øker. Så vi minker sannsynlgieht for type 1 men øker for 2.
Øker sjanse fort type 2 fordi redusert signifikans nivå, reduserer man den statistiske kraften til tester, og sannsynlighet for å ikke avvise en falsk hypotese øker.
Hvordan korrigere for multippel testing og unngå type 1 feil?
Bonferroni korreksjon, men veldig konservativ og lite egnet ved svært mange tester, og økt risiko for type 2 feil.
Bonferroni-Holm: mindre konservativ. mindre streng, og beholder mer testens statistiske kraft når antall tester er høyt.
Hva betyr Kohorteffekter?
Referer til variasjon mellom grupper av individer som er født på samme tid og dermed opplever sosiale hendelser på samme stadier i livet. eks er krig, økonomiske opp eller nedturer, og intro til teknologi.
Hva betyr aldereffekt?
handler om endringer som kommer som en naturlig del av aldringsprosessen. Kan inkluderer biologiske, fysiske eller kognitive endringer.
Hva er periodeeffekt?
Handler om hendelser eller påvirkninger som rammer alle aldersgrupper i samfunnet på et gitt tidspunkt. Kan være politiske endringer, naturkatastrofer, epidemier Og så videre..
Punktprevalens
Dette måler antallet individer som har en bestemt tilstand på et bestemt tidspunkt. Det hjelper til med å gi et bilde av hvor utbredt tilstanden er. For eksempel, punktprevalensen av en medikamentbruk ville være antallet personer som tar medisinen på en bestemt dag.