Statistiske metoder Flashcards
Hva er COX-regresjon og når gjøres den?
En statistisk metode.
Den tar for seg tid til hendelse og justerer for flere kovariater.
Brukes for å studere hvordan ulike behandlinger For eksempel påvirker risiko for en hendelse over tid. Justerer for variabler som kan påvirke utfallet, og gir mer nøyaktig estimat av aehandlingseffekt.
Modellen estimerer da en hazardratio (risiko for hendelse gitt tid).
Forutsetninger for å bruke COX-reg?
RR mellom to sammenlignbare grupper må være konstant over tid, dvs at hazard ratio forblir den samme gjennom hele studieperioden.
Sensurering av data er en forutsetning, altså når en pas forlater studien uten at hendelsen har inntruffet, eller når studien avsluttes før hendelsen. Det må være uavhengig av sannsynligheten for at hendelsen inntreffer.
Forklaringsvariablene bør ikke være sterkt korrelert med hverandre. Multikolinearitet kan altså gi ustabile estimater.
Hva er fordeler og ulemper med COX-regresjon?
Fordeler:
- Håndterer sensurert data, altså der personer ikke trekker hendelse godt. Den tar hensyn til det.
- kan inkludere flere multikovariater.
ulemper:
- hazard-ratio må forbli den samme.
- håndterer bare forklaringsvariabler som ikke endres over tid.
- sensitiv for manglende data
- følsom for multikolinearitet, dvs om det er høy korrelasjon mellom forklaringsvariablene.
- tar ikke for seg interaksjoner mellom forklaringsvariabler.
Hva er multikolinearitet?
Det er når flere forklaringsvariabler er sterkt korrelert med hverandre, så variabler inneholder overlappende informasjon og kan være vanskelig å skille.
Kan oppstå upålitelige estimater om det oppstår.
Hvordan håndtere multikolinearitet?
- fjerne variabler eller kombinere variablers om er sterkt korrelert
Hvordan tolke hazard ratio?
Brukes også i overlevelsesanalyser, for å sammenligne risikoen for at en hendelse inntreffer på gitt tidspunkt.
HR = 1 ingen forskjell i risiko mellom gr.
Hr > 1: høyere risiko for hendelsen i den andre gruppen sammenlignet med den andre.
<1 Lavere risiko for hendelsen
HR på 2: indikerer at hendelsen er dobbelt så sannsynlig å inntreffe i den ene gruppen på ethvert tidspunkt sammenlignet med den andre.
Hva er et konfidensintervall?
Det er et område som gir oss en ide om hvor nøyaktig et estimat(den sanne verdien) fra en studie er.
Viser oss området hvor vi tror den sanne verdien mest sannsynlig ligger.
Dersom vi gjentar studien mange nok ganger, ville fremdeles 95% av konfidensintervallet fra denne studien forekomme i neste som sanne parameterverdier.
Fremdeles 5% sjanse for at intervallet ikke inneholder den sanne parameter verdien
Hva vil det si hvis konfidensintervallet inkluderer 1?
Da betur det at det er en risiko for at det ikke er noen reell forskjell. Da kan vi ikke med sikkerhet si at resultatet er statistisk signifikant
Hvordan varierer bredden til et konfidensintervall?
Jo større utvalg vi har, jo smalere konfidens intervaller får vi.
Jo flere observasjoner vi har, desto mer informasjon har vi om populasjonen, noe som reduserer usikkerheten i estimatet.
Høy variabilitet i data vil gi bredere konfidensintervall, fordi det er store spredninger og mer usikkerhet om sanne verdier.
Hva slags verdier tar konfidensintervaller hensyn til?
- Tar hensyn til tilfeldige feil, ikke systematisk feil (Bias) som kan oppstå.
konfidensintervallet er basert på statistiske fordelingen av dataene. Det beregnes ved å bruke informasjon som standardavvik eller standardfeil, som representerer variasjonen i de innsamlede dataene. Derfor tar konfidensintervallet høyde for tilfeldige variasjoner i dataene.
Fordi systematiske feil ikke er en del av de tilfeldige variasjonene i dataene, vil konfidensintervallet ikke fange opp effekten av disse feilene.
Hva betyr HR<1 og HR>1?
HR < 1 –> betyr det er lavere risiko for hendelsen i den ene gruppen sammenlignet med den andre.
HR > 1 –> Høyere risiko for hendelsen i den ene gruppen sammenlignet med den andre.
Hva er Kaplan-Meier analyse og når gjøres den?
Er en statistisk metode som brukes i overlevelsesanalyse for å estimere overlevelse fra tid til hendelse data.
Måler tid fra startpunkt til en bestemt hendelse inntreffer, som død.
Kurven faller for hvert tidspunkt en hendelse inntreffer!
X-akse (tid): Viser tiden fra startpunktet.
Y-akse (overlevelsessannsynlighet): Viser den estimerte sannsynligheten for å overleve eller være hendelsesfri.
- tar hensyn til de som ikke har opplevd hendelsen før.
Epidemiologi:
For å undersøke hvordan ulike faktorer (som miljø, genetikk eller livsstil) påvirker tiden til en bestemt hendelse i en befolkning.
Hvilke fordeler og ulemper finnes med kaplan-meier analyse?
fordel:
- håndterer sensurert data(de som ikke har opplevd hendelse)
- lett å forstå
begrensninger:
- Ingen justering for kovariater: Kaplan-Meier-analyse er ikke i stand til å justere for potensielle konfoundere eller kovariater. Det betyr at hvis du ønsker å kontrollere for flere faktorer samtidig (som alder, kjønn, eller andre risikofaktorer), må du bruke en annen metode som Cox-regresjon.
Hva er sensitivitetsanalyse og når gjøres den?
tester hvor sensitivt resultatene er for variasjon i variabler.
- vurderer robusthet av resultat.
- identifiserer variabler mede størst innvirkning på resultat.
- gjøres for å sjekke at resultatene er robuste mot variasjoner
- teste robusthet av funn mot potensielle skjevheter, konfunderende faktorer eller manglende data.
Hvilke sensitivitetsanalyser finnes?
enveis: variere en variabel om gangen for å se effekt på resultat.
flerveis: variere to eller flere variabler samtidig.
eks når man gjør en sånn analyse:
- estimere risiko for en sykdom basert på en selvrapportert eksponering.
- mulighet for rapporteringsskjevhet eller feilklassifisering
- justere analysen for ulike grader av feilklassifisering for å se hvordan dette påvirker risikoestimat.