Week 6 Flashcards
wat valt alles onder het Algemene Lineair Model?
alles met kwantitatieve y
alle toetsen voor kwantitatieve y uitvoerbaar met?
> wat vergelijk je?
F toets
> altijd vergelijken van een complete model met een reduced model
2 regels om aantal onafhankelijke variabelen te selecteren
- genoeg om het model nuttig te maken en om goede power te hebben
- zo simpel mogelijk
hoezo is R² geen goed criterium om een model te kiezen?
R² kan niet afnemen als je predictoren toevoegt
> je zou dus het meest complexe model kiezen, dit model brengt echter nadelen
3 types exploratieve model selectie
- backward elimination - begint met alle predictoren en gooit steeds de slechtste eruit tot dat alle predictoren significante partiele r² verklaren ( alpha ingesteld)
- forward selection - begint zonder predictoren, eerste predictor met hoogste correlatie met y. daarna steeds toevoegen van predictor met hoogste partiele r².
- stepwise regression - modificatie van forward selection: naar elk toevoeging kijken of een predictor overbodig werd
3 nadelen van exploratieve model selectie
- levert niet altijd zinvolle modellen op bv. geen hoofdeffect maar wel interactie
- nominale en werkelijke p waarden komen niet overeen
- (belangrijk) algoritmes zijn gevoelig voor kanskapitalisatie: gevonden schattingen mede product van toevalsfluctuaties
> gevonden model verklaard veel minder in nieuwe steekproef
3 aannames van lineaire modellen
- y is een lineaire functie van predictoren
- conditionele verdeling van y is normaal
- homogene conditionele variantie (homoscedasticiteit)
- aselecte trekking
hoezo neemt bij multicollineariteit de standaardfout toe?
in de formule van standaardfout staat 1 - R² in de noemer
> dus hoe groter R², hoe groter se
> R² is het kwadraat van de multiple correlatie, deze is groot als de predictoren van elkaar afhankelijk zijn (multicollineariteit)
4 problemem van multicollineariteit
- bij toevoeging predictor neemt R² niet toe
- constant houden onrealistisch
- moeilijk om belang van predictor vast te stellen omdat effecten van predictoren vervlochten zijn
- toename in se van de b’s > regressie voorspelling instabiel
3 indicatoren van multicollineariteit
- wel significant omnibus, geen significante effecten per predictor
- grote veranderingen van schatting coefficienten bij toevoegen predictoren
- statistisch checken met Variance Inflation Factor
3 oplossingen voor multicollineariteit
- verwijder predictoren die niets extra verklaren
- maak index of som groepjes variabelen
- bij interactie, centreren