Regressie analyse Flashcards
Wat is een deterministisch model?
Model wat met 100% juistheid kan voorspellen
Wat doet een regressie analyse?
Een regressie analyse schat relaties tussen 1 afhankelijke en 1 onafhankelijke variabele
Wat zijn de voorwaardes voor een regressieanalyse?
Zowel afhankelijke als onafhankelijke variabelen moeten van minimaal interval meetniveau zijn
Onderzoeksvraag moet verklarend zijn
Een schatting moet BLUE zijn, wat houdt dat in?
Best (effeciëntie) Linear Unbiased (zuiverheid) estimator
Wat is de formule van een regressiemodel?
Y= B0 + B1 Xi + ei Y = te verklaren variabele (afhankelijke variabele) X = verklarende variabele B0 = Snijpunt met de y-as (hier start de lijn) B1 = Helling van de lijn (toename.afname in deterministisch component voor y voor elke toename van 1 eenheid in x) B0+B1 = deterministische deel van formule e = toevallige afwijking (aselecte error)
Wat zijn de stappen van de regressieanalyse?
- Hypothetiseer regressie coëfficienten
- Schat modelparameters
- Check verdeling variabelen
- Check modelassumpties
- Schat definitieve model
- Evalueer model
- Interpreteer bevindingen
Wat zijn de assumpties van de regressieanalyse?
- Variabelen zijn van interval meetniveau
(gaat met name om de afhankelijke variabele, onafhankelijke kan ook ander meetniveau zijn, dan gebruik maken van dummy’s) - Variabelen zijn normaal verdeeld
(skewness, kurtosis of pp plot) - Relatie tussen de afhankelijke variabele en elk van onafhankelijke variabelen is lineair
-> Rechte lijn
P > 0.05 (niet sign.) - Multicollineariteit = de samenhang tussen de onafhankelijke variabelen is niet te hoog
- Homoscedasticiteit = de variantie rondom de geschatte waarden van y is voor alle (combinaties van) waarden van x (-en) gelijk
Wanneer is een verklaringskracht hoog of laag?
Lage verklaringskracht = 0.01
Middel verklaringskracht = 0.09
Hoge verklaringskracht = 0.25
Kijk naar adjusted R square
Wat is kurtosis en wanneer is er sprake van?
Steilheid van variabele;
sprake van kurtosis wanneer Kurtosis/SE kurtosis > 2
Bij negatieve kurtosis is de lijn vlakker, bij positieve kurtosis steiler
Wat is skewness?
De scheefheid van de variabele
wanneer mean afwijkt van mediaan
er is sprake van skewness wanneer skewness/SE skewness > 2
Bij stap 6; het evalueren voer je meerdere stappen uit, welke stappen zijn dit?
- Bruikbaarheid controleren
-> kijken of het significant is met een F-toets
h0: Het model is niet bruikbaar om de afhankelijke variabele te voorspellen
H1: het model is wel bruikbaar o, de afhankelijke variabele te voorspellen
P < alfa (0.05) dan h0 verwerpen en dan is het model dus bruikbaar - Significantietest regressiecoëfficienten
kijk naar de beta om te zien welke variabele hoogste unvloed heeft op afhankelijke variabele; hoe dichter bij1 hoe beter
3. Determinatiecoëfficient R2 hoe meer variatie er verklaard wordt; hoe beter het model lijkt op werkelijke situatie 0.0 = geen voorspelling 1.0 = perfecte voorspelling kijk naar de adjusted r-sqaured