Lecture 8 (Correlation and regression analysis pt. 2) Flashcards
Eigenschappen lineaire regressie
- Biedt een vereenvoudigd model van de werkelijkheid
- Correlatie betekent niet dat er een causaal effect is, een regressie analyse kan enkel correlatie aanduiden
Geeft aan hoeveel variatie er totaal bestaat in de te verklaren afhankelijke variabele
Total Sum of Squares (TSS)
Geeft aan hoeveel variatie er onverklaard blijft na het toevoegen van de onafhankelijke variabele
Sum of Squared Errors (SSE)
Hoeveel variatie in de afhankelijke variabele is verklaard door het toevoegen van de onafhankelijke variabele
Regression Sum of Squares (RSS)
Representativiteit (aanname regressie-analyse)
De analyses zijn gebaseerd op een aselecte steekproef (cruciaal)
Functionele vorm (aanname regressie-analyse)
De samenhang tussen x en y is lineair (cruciaal)
Homoscedasticiteit (aanname regressie-analyse)
De conditionele variatie rondom de schatter is gelijk voor alle x (anders, gebruik andere schattingsmethode)
Normale verdeling (aanname regressie-analyse)
De conditionele verdeling van y voor alle x is normaal (gebruik anders grotere steekproef om CLT te bereiken)
Extrapolaren
Dit refereert naar het trekken van conclusies op basis van je regressieanalyse over data die zich niet bevond in jouw steekproef. Dit is gevaarlijk aangezien je hierdoor onrealistische waarden kunt krijgen
Omgaan met uitbijters
Een uitbijter kan resultaten sterk beïnvloeden. Je kunt ze laten zitten in enorme steekproeven, anders kun je een analyse met of zonder uitbijters runnen om te kijken hoeveel invloed ze op je resultaten hebben. Op basis daarvan kun je ze wel/niet verwijderen.