Dummy variabelen Flashcards
wat is het probleem wanneer je CATEGORISCHE onafhankelijke variabelen toevoegt aan een multipele regressie
(hiervoor: alleen onafhankelijke continue variabelen zoals schalen)
een categorische variabele met meer dan 2 categorieën is meestal niet lineair gerelateerd aan de afhankelijke variabele
vb. opleidingsniveau
oplossing: dummy variabelen
–> dan zijn er nog maar 2 categorieën
hoeveel scores heeft een dummy variabele
2: ‘wel’ (1) of ‘niet’ (0)
wat is een dummy variabele
een indicator-variabele die aangeeft of iemand WEL of NIET tot een bepaalde categorie van de onafhankelijke categorische variabele behoort
belangrijk: Voor de interpretatie van de dummies gebruik je de ONgestandaardiseerde regressiecoefficienten, want het is niet zinvol om dummy variabelen in termen van ‘een verandering in standaarddeviatie’ te interpreteren
waarom is er altijd 1 dummy variabele te veel?
dit komt door multicollineariteit. Daarom laat je er altijd eentje weg en is dit je referentie categorie ( die mag je zelf kiezen).
als iemand op alles een 0 scoort, dan moet diegene op de laatste een 1 score
Belangrijk: dummy‐variabele moet een redelijk aantal cases indiceren, anders worden effect van dummy onzeker geschat (grotere standard error)