R - logistisk regresjon Flashcards

1
Q

Hva er RR?

A

er et mål som sammenligner sannsynligheten for en bestemt hendelse, som en sykdom eller et utfall mellom to grupper.

det er sannsynligheten for hendelsen i eksponeringsgruppen delt på sannsynlighet for hendelse i kontroll gr.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hva er OR?

A

det er et annet mål på assosiasjon som sammenligner oddsen for en hendelse i en gruppe med oddsen for samme hendelse i en annen gruppe.

sannsynligheten på at hendelsen skjer delt på at det ikke skjer.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hva er forskjellen på OR og RR?

A

RR er mer direkte og angir en økning eller reduksjon i risiko.

OR er ikke direkte representering i risiko, men heller forholdet mellom to odds.
- ser tilbake i tid.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hva er forskjellen på lineær regresjon og multippel lineær regresjon?

A

LINEÆR REGRESJON:
- kun 1 uavhengig variabel for å forutsi en avhengig variabel.
- prøver å finne en lineær sammenheng mellom de to variablene ved å tilpasse en rett linje til data.

formel:
Y = a+ bx + c.
Y = avhengig variabel
X = uavhengig variabel
a = intercept
b = helning
c = feilleddet

MLR:
- inkluderer to eller flere uavhengige variabler for å forutsi en avhengig variabel.
- prøver å finne en lineær sammenheng mellom den avhengige og flere uavhenggige variabler.
- er en utvidelse av enkel lineær regresjon som tillater mer kompleks analyse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hva indikerer svaret 1, større enn 1 og mindre enn 1 for RR og OR?

A

RR:
1 –> ingen forskjell i risiko mellom de to gruppene.

> 1 er høyere risiko i eksponeringsgruppen sammenlignet med kontroll gruppen.

<1 indikerer lavere risiko i eksponeringsgruppen.

OR:
1 –> oddsen for hendelsen er de samme i begge gruppene.
> 1 hendelsen er mer sannsynlig i eksponeringsgruppen

<1 hendelsen er mindre sannsynlig i eksponeringsgruppen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Når brukes kji kvadrat test?

A
  • bruker når begge variabler er kategoriske.
  • vurderer om det er en signifikant assosiasjon mellom to kategoriske variabler.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Når bruke logistisk regresjon?

A
  • når utfallsvariabel(avhengig variabel) er kategorisk og forklaringsvariabel(uavhengig) er enten kontinuerlig eller kategorisk.
  • modell estimerer odds ratio og sannsynlighet for utfallet basert på forklaringsvariabel.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hva er en T-TEST?

A
  • kontinuerlig utfallsvariabel og kategorisk forklaringsvariabel med kun to kategorisker.
  • brukes for å sammenligne gj.s av to grupper for å se om de er statistisk forskjellige fra hverandre.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hva er MLR?

A
  • MLR brukes når utffalsvariabel er kontinuerlig og forklaringsvariabel kan være en kombinasjon av kontinuerlig eller kategorisk.
  • Den estimerer sammenheng mellom begge variablene og kan inkludere interaksjoner og ikke-lineære relasjoner.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Tegn på at modellen er dårlig?

A
  • HØY AIC
  • Høy OR.
  • ekstreme outliners
  • Lav R^2 og høy residua error.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hva sier residual standard error?

A

Standard error representerer standardavviket til residualene.

LAV RSE: det er bedt siden den indikerer at modellens prediksjoner er tett på de faktiske.

HØY RSE betyr større spredning, og større feil i modellens prediksjoner.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hva vil AIC si i en analyse?

A

Sier noe om modellens kvalitet.
Lav AIC indikerer at det er en bra modell. Dersom vi har lav AIC betyr det at modellen er bedre til å forklare variasjon i data.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hva sier Deviance?

A

Det er et mål på hvor godt en modell passer dataen.

Lav deviance: det er det vi ønsker og indikerer en bedre tilpasning til data.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hva sier Multiple R-squared oss?

A

Representerer andel av variansen i den avhengige variabelen som forklares av de uavhengige variablene i modellen. 0 indikerer at modell ikke forklarer noe varians, mens 1 betyr at modellen forklarer all varians. ‘

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hva sier F-statistisk verdi?

A

HØY F-statistikk indikerer at uavhengig variabel samlet sett gir en signifikant informasjon om variasjonen i avhengig variabel.
HØY VERDI ER BEST → En høy F-statistikk

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

P-verdi?

A

En lav p-verdi, under 0,05 oftest, indikerer at det er lite sannsynlig at modellens resultat er tilfeldig, og at det er en statistisk signifikant sammenheng mellom de uavhengige og avhengige variablene.

17
Q

Hva er individuell feilrate(individual error rate)?

A

Sannsynligheten for at en eller flere tester feilaktig konkluderer at den observerte forskjellen er statistisk signifikant.

18
Q

Hva gjør bonferropni korreksjon?

A

Er en statistisk justering som brukes for å kontrollere for økning av type 1 feil som oppstår når flere hypoteser testes samtidig.

Deler valgt signifikansnivå med antall tester.

19
Q

Utfordringer ved bonferroni?

A
  • kan være konservativ og redusere statistiske styrken. Så ting kan overses fordi signifikansnivå er lavt.
  • forutsetter at alle tester er uavhengige hverandre, og i praksis kan tester være korrelerte.
  • sannsynlighet for type 2 feil øker. Så vi minker sannsynlgieht for type 1 men øker for 2.
    Øker sjanse fort type 2 fordi redusert signifikans nivå, reduserer man den statistiske kraften til tester, og sannsynlighet for å ikke avvise en falsk hypotese øker.
20
Q

Hvordan korrigere for multippel testing og unngå type 1 feil?

A

Bonferroni korreksjon, men veldig konservativ og lite egnet ved svært mange tester, og økt risiko for type 2 feil.

Bonferroni-Holm: mindre konservativ. mindre streng, og beholder mer testens statistiske kraft når antall tester er høyt.

21
Q

Hva betyr Kohorteffekter?

A

Referer til variasjon mellom grupper av individer som er født på samme tid og dermed opplever sosiale hendelser på samme stadier i livet. eks er krig, økonomiske opp eller nedturer, og intro til teknologi.

22
Q

Hva betyr aldereffekt?

A

handler om endringer som kommer som en naturlig del av aldringsprosessen. Kan inkluderer biologiske, fysiske eller kognitive endringer.

23
Q

Hva er periodeeffekt?

A

Handler om hendelser eller påvirkninger som rammer alle aldersgrupper i samfunnet på et gitt tidspunkt. Kan være politiske endringer, naturkatastrofer, epidemier Og så videre..

24
Q

Punktprevalens

A

Dette måler antallet individer som har en bestemt tilstand på et bestemt tidspunkt. Det hjelper til med å gi et bilde av hvor utbredt tilstanden er. For eksempel, punktprevalensen av en medikamentbruk ville være antallet personer som tar medisinen på en bestemt dag.

25
Periodeprevalens
Dette måler antallet individer som har en bestemt tilstand i løpet av en tisdsperiode. Det fanger opp alle de som hadde tilstanden på noe punkt i løpet av tidsperioden, ikke bare ved en bestemt tidspunkt.
26
Terapeutisk intensitet:
Et vanlig mål er DDD/1000 innbyggere/dag, som står for "Defined Daily Doses per 1000 inhabitants per day". Det gir en indikasjon på antagelig daglig bruk av et medikament innen en befolkning.
27
Insidensrate:
Dette er et mål på antall nye tilfeller av en tilstand som oppstår i en bestemt periode blant personer som er i risiko for tilstanden. Insidensraten kan hjelpe med å forstå hvor raskt en sykdom eller tilstand sprer seg.
28
Behandlingstid:
Dette refererer til lengden av tid en person er på en bestemt behandling. Det kan også referere til tiden fra diagnose til start av behandling.
29
Waiting time distribution (WTD):
Tidsperioden folk venter før de starter eller endrer behandling. Dette kan innebære tid fra diagnose til behandlingsstart, eller tiden mellom utløpsdatoer på resepter for å måle medikamentbruk over tid.