HC16 - Assumpties lineaire regressie Flashcards
Wat zijn assumpties?
Eisen waaraan je model moet voldoen, wil je dat de resultaten valide en interpreteerbaar zijn.
Welke theoretische assumpties heeft OLS-regressie?
(1) model is zo goed als je data (2) exogeniteit, niet endogeniteit (3) goed meetinstrument.
Waarom is het van belang dat je model zo goed is als je data?
Bij een sample die niet representatief is, is het moeilijk om een valide model of meetinstrument te ontwikkelen.
Wat is exogeniteit?
Dan leidt X tot Y en niet andersom, deze relatie beargumenteer je adhv theorie.
Wanneer heb je een goed meetinstrument?
Als de vragen meten wat je wilt meten, juiste conceptualisering en vraagstelling dus.
Welke empirische assumpties heeft een OLS-regressie?
(1) lineariteit (2) multicollineariteit (3) onafhankelijke residuen (4) homoscedasticiteit in residuen (5) residuen zijn normaal verdeeld (6) invloedrijke cases.
Wanneer is je model lineair?
Als de relatie tussen X (ook moderatoren en controlevariabelen) en Y kan weergegeven worden door een rechte lijn.
Hoe checken we een model op lineariteit?
Voor elke variabele een scatterplot aanmaken waarin de relatie met Y zichtbaar is. Bij ordinale of nominale variabelen is een boxplot handiger.
Wat zijn gevolgen van een probleem met lineariteit?
Mogelijk foutieve b-waarden.
Wanneer is er sprake van multicollineariteit?
Dan hangen de onafhankelijke variabelen teveel samen en meten hetzelfde onderliggende effect.
Hoe checken we op multicollineariteit?
Vooraf door Pearsons R tussen predictoren (niet hoger dan 0.8) en na de regressie met VIF < 5 of Tolerance < 0.2.
Wat is het gevolg van problemen met multicollineariteit?
Dan zijn bepaalde predictoren niet meer significant binnen het model.
Hoe lossen we multicollineariteit op?
Door het samenvoegen of weglaten van predictoren.
Wat houdt onafhankelijkheid van residuen in?
Dat wil zeggen dat de residuen niet correleren met predictoren.
Hoe checken we op onafhankelijkheid van residuen?
Met een residuals plot van gestandaardiseerde residuen t.o.v. predictoren. De puntenwolk moet gecentreerd zijn rondom de middellijn.