VF : Statistik 3 Flashcards
Vad innebär en linjär regression? vad är R^2 vad är Unstadarited B? vilken formaln kan man använda här?
Kontinuerlig variabel - Måste inte vara normalfördelad R square talar om hur stor andel av variationen i Y som förklaras av X (bara relevant om man letar efter den bästa förklaringsmodellen) skillnad i medelsnitt mellan två värde på x. y= a+b*x
Vad innebär en logistiskt/ binominal regression? vilken formel kan man använda sig här? vad är ett odds?
R square vid logistisk regression är en approximation. Väldigt grovt kan man säga att den uttrycker samma information som vid linjär regression. R^2 kan alltås inte tolkas på samma sätt här som i linjär regerssion - men man kan få ungefär samma info. formel är att ta odds ratio och då får man t.ex. fram cahnsen att kvinnor får en sjukdom jämför med en man _____ Delar t.ex. antal döda i en grupp delat på antal levande i en grupp. (alltså inte på 100%).
Vad är en multivariabel analys?
Förklarar utfallet med flera variabler Tolkning av variabler i multivariabel analys: 1. Dikotoma - Koeffecient ger OR för högsta kategorin jämför med lägsta 2. Kontinuerlig - Hur mycket OR ändras när variabeln ökar med en enhet. Te.x BMI: OR för att få rektumcancer ökar med 1,08 (8%) när BMI ökar med en enhet. • Ålder: OR för att få rektumcancer ökar med 1,05 (5%) när åldern ökar med ett år. 3. Kategorisk - Anger OR för en kategori i relation till referenskategorin
Vad är en överlevnadsanalys?
Överlevnadsanalys består av olika metoder för att ta hänsyn till hur hur tiden påverkar ett utfall Behöver inte handla om just överlevnad/ dödsfall
Vad är förutsättningar för en överlevnadsanalys?
Slumpmässigt urval av population Oberoende av varandra Tiden mäts tills utfall eller tills individer censureras Mätningar börjar vid bestämd tidpunkt
Vad är en Kaplan-Meier överlevnadskurva?
Räknar med tiden för de som censureras i studie Det gör att alla bidrar med något till resultatet trots censurering I andra metoder försvinner de censurerade
Vad är hazard?
Motsats mot survival
Vad är proportional hazard?
Är en mutivarabel modell som används när man vill kotnrillera fler faktorer.
används för:
Sannolikheten att avlida vid tidpunkten t när man vet att individen inte avled före:
Halv-parametrisk: förutsätter inte att överlevnadstiden följer någon bestämd fördelning, däremot ska kurvorna man jämför ha samma fördelning – De oberoende variablerna (x) bör vara konstanta över tiden
Ex. vad är sannolikheten att överleva två år efter en behandling om pat. redan överlevt ett år?
vad är generalied linear model?
Generell modell för alla linjära samband • Bygger på att man vet: • fördelningen av den beroende variabeln (Y) • Kallas i statistikprogrammen för error eller family • En matematisk länk mellan Y och X • T.ex. log eller logit - då får man en rät linje genom att sätta log. Man kan också sätta logit- vilket är log / 1 - log Här ingår: linjär regression logistik regresstion Poissonregression Binomial regression
vad är dikotom variable?
Dikotoma variabler • T.ex: sjuk-frisk, ja-nej • Kan kodas 0 och 1
vad är logrank testet?
Tar händsyn till skillnader överlevnadstid över ett observerat antal händelser under ett tidsintervall och sedan förväntade antal händelser.
man testar om två överlevandskruver är lika med varnadra. om antal händelser är lika och om de inträffar vid ungevär samma tid. Nollhypotes är att kurverna är lika.