meervoudige regressie Flashcards

1
Q

bruto effect

A

naarmate het effect op een variabele afhangt van meerdere onafhankelijke variabelen, weerspiegelt het bruto effect tussen 2 variabelen in bivariate regressie niet meer het reële effect

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

assumptie betreffende de verdeling van de foutenterm

A

1) Normaliteit: de foutenterm 𝜀𝑖 is normaal verdeeld
2) Het gemiddelde van de foutenterm 𝜀𝑖 is nul: 𝐸 𝜀𝑖 = 0
3) Homoskedasticiteit: Var 𝜀𝑖 = 𝜎2
4) Afwezigheid van autocorrelatie: Cov 𝜀𝑖, 𝜀𝑗 = 0 waarbij (i ≠ 𝑗)
5) De onafhankelijke variabelen hebben een variantie die verschilt van 0 (een eindig getal naarmate 𝑁 → ∞) en zijn niet gecorreleerd met de residuen.
6) Het aantal observaties is groter dan het aantal onafhankelijke variabelen opgenomen in het model.
7) Er bestaan geen perfect lineaire relaties tussen de onafhankelijke variabelen onderling

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

partiële regressiecoëfficienten in meervoudige regressie berekening

A

berekening gebeurt in 2 stappen: eerst een bivariate regressie tussen x1 en x2, waarna een bivariatie regressie gebeurt met y en de residuen van x1. Zo bekom je de partiële regressiecoëfficiënt van x1.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

regressiecoëfficiënt in meervoudige regressie interpretatie

A

de regressiecoëfficiënt weerspiegelt het directe effect op de afhankelijke variabele wanneer de onafhankelijke variabele met 1 eenheid stijgt, terwijl de derde onafhankelijke variabele constant blijft (dus bij mensen van hetzelfde opleidingsniveau bv)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

centreren van onafhankelijke variabelen

A

de interpretatie van de constante is verschillend bij gecentreerde onafhankelijke variabelen, het intercept geeft dan de verwachte waarde weer wanneer de onafhankelijke variabelen gemiddeld zijn

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

meervoudige correlatiecoëffciënt R

A

De meervoudige correlatiecoëfficiënt R is de correlatiecoëfficiënt van Pearson tussen de geobserveerde en de verwachte waarden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

interpretatie van de meervoudige determinatiecoëfficiënt R²

A

R² geeft aan welke proportie van de variantie van Y wordt

verklaard door de verschillende onafhankelijke variabelen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

adjusted R²

A

Naarmate onafhankelijke variabelen worden toegevoegd,
toenemen, ook al hebben sommige van deze
geen significant effect op de afhankelijke variabele

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

multicollineariteit

A

onafhankelijke variabelen zijn sterk gecorreleerd. Dit kan je zien wanneer de gestandaardiseerde (!) partiële regressiecoëfficienten groter zijn dan 1. De noemer van de standaardfout bevat de correlatie tussen de onafhankelijke variabelen!

hoe opmerken:
- Naarmate de onafhankelijke variabelen onderling sterker
gecorreleerd zijn, worden de standaardfouten groter en is er grotere onzekerheid met betrekking tot de waarde van de regressiecoëfficiënten in de populatie
=> F testen leiden tot significantie,maar t-testen niet
- groot verschil in de partiële regressiecoëfficiënten wanneer een variabele wordt toegevoegd of weggelaten
- wanneer regressiecoëfficiënten groter dan 1 of kleiner dan -1 zijn

-> interpretatie: de twee onafhankelijke variabelen verklaren hetzelfde

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

minimum/maximum van de kwadratische functie (lineariteit testen)

A

x = -b/2a

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

additiviteitsassumptie

A

Additieve modelspecificatie veronderstelt dat partiële regressiecoëfficiënt 𝛽𝑌𝑋1.𝑋2 die effect van 𝑋1𝑖 op 𝑌𝑖 weerspiegelt na controle voor 𝑋2𝑖 dezelfde is voor alle waarden van 𝑋2𝑖, en omgekeerd, dat partiële regressiecoëfficiënt 𝛽𝑌𝑋2.𝑋1 die effect van 𝑋2𝑖 op 𝑌𝑖 weerspiegelt na controle voor 𝑋1𝑖 dezelfde is voor alle waarden van 𝑋1i

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

multicolleineariteit testen

A

1) Correlatiematrix controleren op correlatiecoëfficiënten tussen onafhankelijke variabelen onderling die groter zijn dan ±0,60

2) In SPSS-output “Tolerance” controleren voor alle onafhankelijke variabelen
- > determinatiecoëfficiënt wordt berekend van de onafhankelijke variabele in fucntie van de andere onafhankelijke variabelen
- > Een tolerantiewaarde kleiner dan 0,1 wijst op multicollineariteitsproblemen

3) In SPSS-output “Variation Inflation Factor” controleren voor alle onafhankelijke variabelen
- > De VIF-waarde is gelijk aan 1/tolerantiewaarde
- > Een VIF-waarde groter dan 10 wijst op multicollineariteitsproblemen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

afwezigheid van autocorrelatie

A

Met andere woorden: wanneer residuen onderling niet gecorreleerd zijn voor verschillende waarden van de onafhankelijke variabele is er sprake van afwezigheid van autocorrelatie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

heteroscedasticiteit

A

De spreiding van de foutenterm verschilt voor verschillende waarden van Y. Dit kan ervoor zorgen dat de standaardfout wordt onderschat en kan leiden tot het onterecht verwerpen van de nulhypothese.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

normaliteitsassumptie residuen

A

de normaliteitsassumptie is belangrijk voor kleine steekproeven (met N

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

outliers of uitschieters

A

Waarden die een grote fout bij voorspelling hebben of een grote waarden van het residu. In een scatterplot van de gestandaardiseerde residuenin functie van de gestandaardiseerde voorspelde waarden zijn uitschieters afwijkingen van 3x de standaardafwijking van het gemiddelde