Hoorcollege 6B: Meervoudige regressieanalyse Flashcards
1
Q
- Wat is het doel van een regressieanalyse?
2. Wanneer doe je een MEERVOUDIGE regressieanalyse? (Voorwaarden?)
A
- Doel van een regressieanalyse is een voorspelling doen over de afhankelijke variabele (y), wanneer je de waarde van de onafhankelijke variabele (x) invult. Regressieanalyse gaat over het effect van x op y.
- Een meervoudige regressieanalyse= toevoeging van een meerdere (3e, 4e, 5e) variabelen.
VOORWAARDEN:
- Meerdere onafhankelijke variabelen, maar altijd 1 afhankelijke variabele.
- afhankelijke variabele = minimaal intervalniveau.
- minimaal 1 onafhankelijke variabele = minimaal intervalniveau, de rest mag dummyvariabelen zijn.
- dummyvariabelen: mag categorisch zijn, maar moet wel hergecodeerd worden naar de waarden 0 en 1.
- geen kromlijnig verband tussen x en y variabelen.
2
Q
- Wat zijn dichotome variabelen?
2. Wat wordt bedoeld met ‘zuivere effect van beta’?
A
- Dichotome variabelen= variabele die 2 waarden kent, 1 en 2, zoals geslacht ‘man of vrouw’. Maar je kan niet rekenen met deze nominale variabelen, dus hercodeer je de dichotome variabele in een dummyvariabele met de waarden 0 en 1. Waarde 0 kan je zien als het niet aanwezig zijn van een kenmerk, en 1 het wel aanwezig zijn van een kenmerk. 0=niet vrouw, 1=vrouw. Nu kun je ermee rekenen (gemiddelde) en als je gemiddelde kan berekenen dan zien we het als een numeriek variabele.
»> Bij een dummyvariabele: geeft de b (van geslacht bv.) het gemiddelde verschil tussen de 0-categorie en de 1-categorie, bijv: dat mannen GEMIDDELD 0,99 minder vaak vrouwenbladen lezen dan vrouwen. - Bij de gestandaardiseerde regressiecoefficient (beta) zie je het zuivere effect in een meervoudige regressieanalyse van x op y (welke beta is het hoogst? maakt niet uit of het negatief is). Welk onafhankelijke variabele is de sterkste voorspeller voor de afhankelijke variabele? Er word gebruik gemaakt van z-waarden, want de variabele is ontdaan van zijn meeteenheid. Hij wordt gestandaardiseerd zodat je meerdere variabelen met elkaar kunt vergelijken. De b is ook afhankelijk van de meeteenheid, bv is afhankelijk of je leeftijd in jaren of maanden is gemeten.
3
Q
- Waar moet je rekening mee houden bij rapporteren van regressieanalyse? (Echte rapporteren en uitvoeren later uitwerken!)
A
- a) Regression= onder df: het getal staat voor hoeveel onafhankelijke variabelen je hebt gebruikt in de analyse, dus 3, als je 3 onafhankelijke variabelen hebt gebruikt. Bij enkelvoudige regressie was dat 1.
b) Significantie kan stijgen door het toevoegen van meerdere onafhankelijke variabelen. Dan was het eerst niet significant en nu wel.
c) Hoe meer onafhankelijke variabelen je toevoegt, stijgt die R2 dan ook, dus verklaart R2 beter de afhankelijke variabele (y).
d) Omdat je drie lijnen hebt, heb je dus ook drie nulhypotheses bij een meervoudige regressieanalyse.
e) Bij de (losse) regressielijnen is er een belangrijke toevoeging: interpretatie erbij (hoe meer, hoe meer/hoe minder) + ‘onder constant houding van …’ (= je kijkt maar naar 1 aspect in de lijn, en de rest houd je constant of ‘op zwart’.