Thema 4: Regressieanalyse Flashcards
Wat is regressieanalyse?
Methode om een model te bouwen waarbij 1 (enkelvoudige) of meerdere voorspelelrs zo goed mogelijk worden ingezet om een andere variabele (afh variabele) te voorspellen
Wat levert de RA op?
Een proportie verklaarde variantie: dat deel van de afh variabele dat kan worden voorspeld (verklaard) met de voorspeller(s)
Wat is enkelvoudige regressieanalyse?
- Uitbreiding van bivariate correlaties naar voorspellingsmodel
- Produceert regressievergelijking
Wat zijn correlatiecoefficienten?
Effectgroottes die kunnen worden gekwadrateerd om een schating te krijgen van de proportie verklaarde variantie
Wat is een regressievergelijking?
Model waarmee, gegeven de waarde op de ene variabele, de waarde op een andere variabele kan worden voorspeld.
Asymmetrisch: schaalverdeling van elke variabele maakt uit
Wat is het residu?
Verschil tussen de voorspelde waarde en de echte scores. Wil je zo klein mogelijk hebben
Wat zijn gestandaardiseerde regressiecoefficienten?
- Maakt schaalverdeling van alle variabelen gelijk: elke variabele uitgedrukt in stdv.
- Handig voor vergelijking van modellen waarbij niet alle predictoren op dezelfde schaal zijn gemeten.
- Berekenen dmv
a) centeren: van elk datapunt gem. aftrekken
b) datapunt / stdv. van variabele
c) regressieanalyse herhalen met nieuwe variabelen
Beschrijf asymmetrie voor lineaire regressie
Aaname dat alle error in de afh variabele zit.
Noem de 5 aannames van regressieanalyse
- Continu meetniveau
- Lineariteit
- Onafhankelijkheid
- Normaliteit
- Homoscendasticiteit
Wat is homoscendasticiteit?
Homogeniteit van varianties. Aanname dat de variantie in de afh variabele = voor elke waarde van de onafh variabele.
2 manieren onderzoeken:
1. scatterplot: even ver van regressielijn?
2. toetsen, levene’s test
Wat is multicollineariteit?
Zachte aanname. De voorspellers zijn goed uit elkaar te voorspellen.
Betekent dat er minder informatie in je regressiemodel beschikbaar is –> veel standaardfouten (–> bredere CI).
Oplossen door meer deelnemers.
Uitrekenen door VIF en tolerantie
Hoe bereken je aantal deelnemers?
Als voorspellers niet samenhangen: aantal deelnemers / 1-r^2
Wat is tolerantie?
- Tolerantie van een voorspeller is 1-R^2
Wat is VIF?
- Variance Inflation Factor
- Factor waarmee de varianties van je schattingen toenemen in vergelijking met wanneer je voorspellers onafhankelijk waren geweest.
- 1/ tolerantie. Stel VIF 1.5 dan worden schattingen 1.5x minder accuraat
Wat gebeurt er bij overlap in voorspellers? Bij multivariate regressie
- Verklaarde variantie in de afh variabele hoort dan bij beide voorspellers.
- R^2 nog wel waardevol: geeft aan hoeveel we in totaal begrijpen van het behaalde cijfer met beide constructen samen