dummy regressie Flashcards
keuze van de referentiecategorie
Dit heeft een invloed op de grootte van dde standaardfout en de interpretatie van de regressiecoëfficiënten. De referentiecategorie moet dus voldoende groot zijn, want wanneer deze te klein is, zullen de regressiecoëfficiënten minder snel significant zijn.
- > bij nominale variabelen: kies de modale categorie
- > bij ordinale variabelen: kies de laagste
interpretatie van de regressierechte bij dummy regressie
- constante: de (gemiddelde) verwachte waarde van de referentiecategorie
- partiële regressiecoëfficiënten: de waarde voor x ligt hoger/lager dan de de referentiecategorie
interpretatie f en t-testen
F-test is een test voor de variabele in zijn geheel, de t-testen gaan telkens na of er sprake is van een significant verschil tussen het gemiddelde van 1 categorie en dat van de referentiecategorie. T-testen uitvoeren heeft enkel zin wanneer het model in zijn GEHEEL significant is
interpretatie regressievergelijking met interactietermen
In een regressievergelijking weerspiegelen de regressiecoëfficiënten de score van y ten opzichte van de referentiecategorie, ongeacht de kenmerken in de interactietermen
lineariteit testen bij dummy-regressie
Toevoegen van een gekwadrateerde variabele: continue variabele! (0 of 1 tot een macht verheffen gaat niet)
OF
continue variabele in categorieën indelen
variantieanalyse
Een alternatieve methode voor modellen met continue en categorische onafhankelijken die gericht zijn op het testen van significanties. Categorische veranderlijken worden factoren genoemd en niet-categorische veranderlijken worden covarianties genoemd. Bij variantieanalyse splitst men de totale variatie of in binnengroepsvariatie (SSW) en tussengroepsvariatie (SSB), deze zijn gebasseerd op een schatting van de binnen- en tussengroepsvariaNtie
one-way analysis of variance
modellen met 1 categorische onafhankelijke
n-way analysis of variance
modellen met meerdere categorische onafhankelijken en 1 continue onafhankelijke
analysis of covariance (n-way ANCOVA)
modellen met meerdere continue en categorische onafhankelijken
Levenes test for equality variances
test homoscedasticiteitsassumptie, i.e. test of spreiding van
variabele in populatie gelijk is in beide groepen. Maw: test of de standaardafwijkingen in de twee groepen gelijk zijn in bij de t-toets. Wanneer de test significant is, moeten we naar de tweede rij kijken, maar wanneer deze groter is van 0,05 mogen we geen conclusies trekken.
F-ratio in one-way analysis of variance
de verhouding van de tussengroepsvariatie en binnengroepsvariatie.
- F 1 = verwerpen de nulhypothese, minstens 1 van de 2 categorieën verschillen => post-hoc testen uitvoeren
bonferroni correctie
overschrijdingskans bij testen op afzonderlijke contrasten wordt aangepast in functie van het aantal geteste contrasten: 𝛽 = 𝛼/𝑁
waarbij 𝛽 het te hanteren significantieniveau weerspiegelt voor testen van afzonderlijke contrasten, 𝛼 het beoogde significantieniveau voor de volledige set van contrasten en N het aantal geteste contrasten
MCA
Resultaten van variantie-analyse kunnen worden aangevuld met resultaten van Multiple Classification Analysis: geeft bijkomende informatie over aard en kracht van het verband
MAAR heeft teeds betrekking op de additieve modelspcificatie