Kap 13 (part 1) Flashcards

Question 1

Q

Forskellen på simpel og multipel lineær regression

Answer

A

Simpel: 1 forklarende variabel
Multipel: Flere forklarende variabel

Question 2

Q

Hvorfor bruger vi R2-adjusted frem for R2?

Answer

A

Vi bruger R2-adjusted frem for R2, da forklaringsgraden vil stige for R2, jo flere variable der bruges, selvom det er helt tilfældige tal. R2-adjusted tager højde for antallet af variable og vil derfor ikke blive påvirket.

Question 3

Q

Interpolation og ekstrapolation

Answer

A

Interpolation: Vi forudsiger inden for hvor vi har data.
Ekstrapolation: Vi forudsiger uden for hvor vi har data.

Eks: Vi har data for boliger på 80-300 kvm.
Inter: Hvad koster en bolig på 250 kvm?
Ekstra: Hvad koster en bolig på 400 kvm?

Inter vil altså have en lavere usikkerhed end ekstra.

Question 4

Q

Mindste kvadraters metode

Answer

A

Mindste kvadraters metode er den regressionslinie (givet ved regressionsligningen) der minimerer summen af den lodrette afstand mellem punkterne/observationerne og deres estimater

Question 5

Q

Hvad fortæller Rsquare-værdien?

Answer

A

Rsquare-værdien fortæller hvor meget af den totale variation modellen kan forklare.
Altså: Rsquare = forklaret variation / total variation

Question 6

Q

Er Rsquare det samme som koalitionen i anden?

Answer

A

Rsquare er det samme som koalitionen i anden (gælder KUN når der er én forklarende variabel).

Question 7

Q

Hvad betyder SAK?

Answer

A

Summen af kvadraterne (sum of squares).

Question 8

Q

Hvordan identificerer man en outlier?

Answer

A

Observationer med et standardiseret residual der er større end 3 eller mindre end -3 (altså 3 standardafvigelser) i absolutte værdier ofte repræsentere en outlier.

Question 9

Q

De 4 forudsætninger for både simpel og multipel regressionsanalyse

Answer

A

1) Linearitet
Lineær sammenhæng mellem samtlige forklarende variabel, hver for sig og responsvariablen y
2) Konstant varians for residualer
3) Stokastisk uafhængighed mellem residualer
4) Normalitet. Residualerne er normalfordelte

Question 10

Q

Hvordan afgør man forudsætning 1. linearitet?

Answer

A

Metode 1: X-akse: estimerede værdier. Y-akse: standardiserede residualer. I dette plot skal punkterne være mest koncentreret om middelværdien 0 og mindre jo længere væk man kommer. Skal ligne nogen har skudt med et haglgevær.

Metode 2: Partielle plots for Y1 og X1i og Y1 og X2i osv. Følger punkterne den lineære model?

Question 11

Q

Forudsætning 2: Konstant varians.

Answer

A

Ikke gældende hvis fx variationen stiger (residualerne er mere spredt ud) når x stiger.

Question 12

Q

Forudsætning 3: Stokastisk uafhængighed

Answer

A

Denne forudsætning er ikke opfyldt, hvis de enkelte Yi-observationer er indbyrdes korreleret/afhængige af hinanden. I så fald er der autokorrelation (dvs. at Yi-observationerne er korreleret med sig selv).

Tidsserier har ofte sådan autokorrelation, dvs. afhængighed mellem de enkelte Yi-observationer indbyrdes.
Eksempelvis udviklingen i ejendomspriser over tid
Udviklingen i renter/aktiekurser

Forudsætningen om stokastisk uafhængighed, dvs. ingen autokorrelation kan kun vurderes grafisk, når observationernes rækkefølge er entydigt fastlagt i form af en tidsmæssig rækkefølge

Question 13

Q

Forudsætning 4: Normalitet

Answer

A

Normalitet indebærer at Yi-observationerne følger en normalfordeling
Dette svarer til at de standardiserede residualer følger en standardnormalfordeling med middelværdi 0 og standardafvigelse på 1

Denne forudsætning vurderes på baggrund af et normalfraktildiagram

Normalfraktildiagram kan ikke opnås direkte, men kan tegnes ved at gemme de standardiserede residualer (Studentized Residual) og herefter benytte Distribution på variablen, hvor de standardiserede residualer er gemt, og tegne et Normal Quantile Plot

Question 14

Q

Hvad kigger vi på efter vi har tjekket de 4 forudsætninger?

Answer

A

Når vi har tjekket de 4 forudsætninger for regressionsmodellen er opfyldt eller delvist opfyldt

Tjekker vi herefter følgende for at vurdere modellens anvendelighed
Outliers/Indflydelsesrige observationer
Multikollinaritet
F-test samt variansanalyseskemaet og forklaringsgraden
Partielle test
Modelreduktion
Konfidensintervaller for β1, β2,…..,βp
Konfidensinterval  for E(Yi)
Prediktionsinterval Yi

Kap 13 (part 1) Flashcards

(14 cards)