R - logistisk regresjon Flashcards

1
Q

Hva er RR?

A

er et mål som sammenligner sannsynligheten for en bestemt hendelse, som en sykdom eller et utfall mellom to grupper.

det er sannsynligheten for hendelsen i eksponeringsgruppen delt på sannsynlighet for hendelse i kontroll gr.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hva er OR?

A

det er et annet mål på assosiasjon som sammenligner oddsen for en hendelse i en gruppe med oddsen for samme hendelse i en annen gruppe.

sannsynligheten på at hendelsen skjer delt på at det ikke skjer.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hva er forskjellen på OR og RR?

A

RR er mer direkte og angir en økning eller reduksjon i risiko.

OR er ikke direkte representering i risiko, men heller forholdet mellom to odds.
- ser tilbake i tid.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hva er forskjellen på lineær regresjon og multippel lineær regresjon?

A

LINEÆR REGRESJON:
- kun 1 uavhengig variabel for å forutsi en avhengig variabel.
- prøver å finne en lineær sammenheng mellom de to variablene ved å tilpasse en rett linje til data.

formel:
Y = a+ bx + c.
Y = avhengig variabel
X = uavhengig variabel
a = intercept
b = helning
c = feilleddet

MLR:
- inkluderer to eller flere uavhengige variabler for å forutsi en avhengig variabel.
- prøver å finne en lineær sammenheng mellom den avhengige og flere uavhenggige variabler.
- er en utvidelse av enkel lineær regresjon som tillater mer kompleks analyse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hva indikerer svaret 1, større enn 1 og mindre enn 1 for RR og OR?

A

RR:
1 –> ingen forskjell i risiko mellom de to gruppene.

> 1 er høyere risiko i eksponeringsgruppen sammenlignet med kontroll gruppen.

<1 indikerer lavere risiko i eksponeringsgruppen.

OR:
1 –> oddsen for hendelsen er de samme i begge gruppene.
> 1 hendelsen er mer sannsynlig i eksponeringsgruppen

<1 hendelsen er mindre sannsynlig i eksponeringsgruppen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Når brukes kji kvadrat test?

A
  • bruker når begge variabler er kategoriske.
  • vurderer om det er en signifikant assosiasjon mellom to kategoriske variabler.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Når bruke logistisk regresjon?

A
  • når utfallsvariabel(avhengig variabel) er kategorisk og forklaringsvariabel(uavhengig) er enten kontinuerlig eller kategorisk.
  • modell estimerer odds ratio og sannsynlighet for utfallet basert på forklaringsvariabel.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hva er en T-TEST?

A
  • kontinuerlig utfallsvariabel og kategorisk forklaringsvariabel med kun to kategorisker.
  • brukes for å sammenligne gj.s av to grupper for å se om de er statistisk forskjellige fra hverandre.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hva er MLR?

A
  • MLR brukes når utffalsvariabel er kontinuerlig og forklaringsvariabel kan være en kombinasjon av kontinuerlig eller kategorisk.
  • Den estimerer sammenheng mellom begge variablene og kan inkludere interaksjoner og ikke-lineære relasjoner.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Tegn på at modellen er dårlig?

A
  • HØY AIC
  • Høy OR.
  • ekstreme outliners
  • Lav R^2 og høy residua error.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hva sier residual standard error?

A

Standard error representerer standardavviket til residualene.

LAV RSE: det er bedt siden den indikerer at modellens prediksjoner er tett på de faktiske.

HØY RSE betyr større spredning, og større feil i modellens prediksjoner.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hva vil AIC si i en analyse?

A

Sier noe om modellens kvalitet.
Lav AIC indikerer at det er en bra modell. Dersom vi har lav AIC betyr det at modellen er bedre til å forklare variasjon i data.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hva sier Deviance?

A

Det er et mål på hvor godt en modell passer dataen.

Lav deviance: det er det vi ønsker og indikerer en bedre tilpasning til data.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hva sier Multiple R-squared oss?

A

Representerer andel av variansen i den avhengige variabelen som forklares av de uavhengige variablene i modellen. 0 indikerer at modell ikke forklarer noe varians, mens 1 betyr at modellen forklarer all varians. ‘

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hva sier F-statistisk verdi?

A

HØY F-statistikk indikerer at uavhengig variabel samlet sett gir en signifikant informasjon om variasjonen i avhengig variabel.
HØY VERDI ER BEST → En høy F-statistikk

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

P-verdi?

A

En lav p-verdi, under 0,05 oftest, indikerer at det er lite sannsynlig at modellens resultat er tilfeldig, og at det er en statistisk signifikant sammenheng mellom de uavhengige og avhengige variablene.

17
Q

Hva er individuell feilrate(individual error rate)?

A

Sannsynligheten for at en eller flere tester feilaktig konkluderer at den observerte forskjellen er statistisk signifikant.

18
Q

Hva gjør bonferropni korreksjon?

A

Er en statistisk justering som brukes for å kontrollere for økning av type 1 feil som oppstår når flere hypoteser testes samtidig.

Deler valgt signifikansnivå med antall tester.

19
Q

Utfordringer ved bonferroni?

A
  • kan være konservativ og redusere statistiske styrken. Så ting kan overses fordi signifikansnivå er lavt.
  • forutsetter at alle tester er uavhengige hverandre, og i praksis kan tester være korrelerte.
  • sannsynlighet for type 2 feil øker. Så vi minker sannsynlgieht for type 1 men øker for 2.
    Øker sjanse fort type 2 fordi redusert signifikans nivå, reduserer man den statistiske kraften til tester, og sannsynlighet for å ikke avvise en falsk hypotese øker.
20
Q

Hvordan korrigere for multippel testing og unngå type 1 feil?

A

Bonferroni korreksjon, men veldig konservativ og lite egnet ved svært mange tester, og økt risiko for type 2 feil.

Bonferroni-Holm: mindre konservativ. mindre streng, og beholder mer testens statistiske kraft når antall tester er høyt.

21
Q

Hva betyr Kohorteffekter?

A

Referer til variasjon mellom grupper av individer som er født på samme tid og dermed opplever sosiale hendelser på samme stadier i livet. eks er krig, økonomiske opp eller nedturer, og intro til teknologi.

22
Q

Hva betyr aldereffekt?

A

handler om endringer som kommer som en naturlig del av aldringsprosessen. Kan inkluderer biologiske, fysiske eller kognitive endringer.

23
Q

Hva er periodeeffekt?

A

Handler om hendelser eller påvirkninger som rammer alle aldersgrupper i samfunnet på et gitt tidspunkt. Kan være politiske endringer, naturkatastrofer, epidemier Og så videre..

24
Q

Punktprevalens

A

Dette måler antallet individer som har en bestemt tilstand på et bestemt tidspunkt. Det hjelper til med å gi et bilde av hvor utbredt tilstanden er. For eksempel, punktprevalensen av en medikamentbruk ville være antallet personer som tar medisinen på en bestemt dag.

25
Q

Periodeprevalens

A

Dette måler antallet individer som har en bestemt tilstand i løpet av en tisdsperiode. Det fanger opp alle de som hadde tilstanden på noe punkt i løpet av tidsperioden, ikke bare ved en bestemt tidspunkt.

26
Q

Terapeutisk intensitet:

A

Et vanlig mål er DDD/1000 innbyggere/dag, som står for “Defined Daily Doses per 1000 inhabitants per day”. Det gir en indikasjon på antagelig daglig bruk av et medikament innen en befolkning.

27
Q

Insidensrate:

A

Dette er et mål på antall nye tilfeller av en tilstand som oppstår i en bestemt periode blant personer som er i risiko for tilstanden. Insidensraten kan hjelpe med å forstå hvor raskt en sykdom eller tilstand sprer seg.

28
Q

Behandlingstid:

A

Dette refererer til lengden av tid en person er på en bestemt behandling. Det kan også referere til tiden fra diagnose til start av behandling.

29
Q

Waiting time distribution (WTD):

A

Tidsperioden folk venter før de starter eller endrer behandling. Dette kan innebære tid fra diagnose til behandlingsstart, eller tiden mellom utløpsdatoer på resepter for å måle medikamentbruk over tid.