F5 Multipel regression Flashcards
Hvordan fungerer statistisk kontrol i den multiple regressionsmodel?
I stedet for kun at analysere én variabels effekt på den afhængige variabel (som i simpel regression), inkluderer multiple regression flere forklarende variabler
Hvordan fortolkes hældningskoefficienten i den multiple regressionsmodel?
Den gennemsnitlige ændring i den afhængige variabel Y for én enhedsstigning i X1, holder man alle andre uafhængige variabler konstante.
Er beta-1 > 0 = positiv sammenhæng
Er beta1 < 0 = negativ sammenhæng
Er beta1 = 0 ingen signifikant sammenhæng
Hvad er udeladt variabel bias (UVB)?
Når en vigtig baggrundsvariabel (der er korreleret med både X og Y) udelades af regressionsmodellen → estimaterne af koefficienterne for de inkluderedes variabler (X & Y) giver et forkert billede af sammenhængen (bias) fordi udeladte variabler ikke er inkluderet.
Hvordan hænger UVB sammen med selektionsbias?
Det er det samme :)
Hvad definerer en god og en dårlig kontrolvariabel?
En god kontrolvariabel påvirker både den afhængige variabel (Y) og den uafhængige variabel (X), den hjælper med at isolere den sande effekt af X på Y.
En dårlig kontrol variable er påvirket af den uafhængige variabel (X) og påvirker den afhængige variable (Y) = post-treatment bias.
Hvad er multikollinearitet?
Det opstår når to eller flere uafhængige variabler i en regressions-model er tæt forbundne. Dette kan føre til usikre estimater af koefficienterne (store standardfejl) eller at variable bliver helt udeladt af regressionen
Hvordan foretages en regressionsanalyse med en kategorisk uafhængig variabel?
Når en variabel er kategorisk, omdanner man den til dummy variable med en referencekategori.
I R-studio antager funktionen for en lineær model: lm() at variablerne er kontinuere. Ved at sætte as_factor() rundt om en variabel behandler funktionen dem som kategorisk, og R udregner selv dummyvariablerne