thema 5 Flashcards
Regressieanalyse
een instrument voor onderzoekers (en studenten) waarmee op basis van de waarde op de ene variabele, een voorspelde waarde op de andere variabele berekend kan worden. Bovendien geeft regressieanalyse een indruk hoe accuraat die voorspelling zal zijn.
Het intercept (vaak aangeduid als ( β0 )
De verwachte waarde van de
afhankelijke variabele wanneer het onafhankelijke variabele gelijk is aan nul.
De eerste zogenaamde regressiecoëfficiëent in het regressiemodel en wordt aangeduid met β0, B0 of b0.
extrapolatie
Het berekenen van voorspellingen van een model voor waarden buiten het bereik van de data waarop dat model gebaseerd is.
Interpolatie
Het gebruik van een model om tussenliggende waarden te berekenen.
De tweede regressiecoëfficiënt oftewel, β1
De helling van de lijn. Deze regressiecoëfficiënt geeft de stijging (of daling) in de variabele op de y-as aan als de variabele op de x-as met 1 eenheid toeneemt.
dichotome voorspeller
Kan maar twee waarden aannemen. Om een dichotome voorspeller als intervalvariabele mee te nemen in regressieanalyse, moet aan elk van deze twee waarden een getal toegekend worden. Het representeren van de meetwaarden van een categorische variabele met getallen heet dummycoderen.
De proportie verklaarde variantie (R2)
De R2-waarde geeft ons een idee van hoe goed onze onafhankelijke variabele(n)
de variatie in de afhankelijke variabele kan verklaren. Een hogere R2 betekent
dat ons model een groter deel van de variabiliteit in de responsvariabele
verklaart.
Voorbeeld: Als de R2 van onze studietijd-cijfer regressie 0,8 is, betekent dit dat
80% van de variatie in cijfers verklaard kan worden door hoeveel tijd studenten
besteden aan studeren.
De verklaarde variantie wordt berekend door de correlatiecoëfficiënt te kwadrateren.
Gestandaardiseerde waarden
In een regressiestudie wordt er soms met
gestandaardiseerde waarden van X en Y gewerkt, dit zijn z-scores. Een reden om
de gegevens te standaardiseren is,
Vergelijkbaarheid: Standaardisatie transformeert verschillende variabelen met
verschillende schalen (zoals inkomsten en leeftijd) naar een gemeenschappelijke
schaal. Dit maakt het mogelijk om de sterkte van de effecten van verschillende
onafhankelijke variabelen op de afhankelijke variabele direct met elkaar te
vergelijken.
Wanneer zowel x als y gestandaardiseerd zijn, is de regressiecoëfficiënt (bèta)
gelijk aan de correlatiecoëfficiënt (r).