ch4 Flashcards
wanneer maak je gebruik van regressie? en wat is het verschil met correlationeel onderzoek
Als er sprake is van interval/ratio meetniveau en een lineaire samenhang.
Correlatie beschrijft alleen de samenhang tussen 2 variabelen met regressie kun je ook uitrekenen wat de verandering van een variabele betekend voor bijvoorbeeld het streefgewicht.
Bij regressie kun je de samenhang beschrijven aan de hand van een rechtte lijn (als er sprake is van lineaire samenhang), bij correlationeel kun je ook iets met een niet-lineaire samenhang.
Least squares lijn
de lijn die het best past bij de data wordt gekozen. SPSS rekent dit uit door de least squares lijn te kiezen, dit is de lijn met het kleinste verschil tussen de lijn en de punten in een spreidingsdiagram.
dus het is een rechtte lijn om de samenhang tussen 2 interval/ratio variabelen te beschrijven.
hoe bereken je enkelvoudige regressie?
- Dit kan met een lineaire formule.
- Rechte lijn om de samenhang tussen twee interval/ratio variabelen te beschrijven
Y = b0 + b1 ∙X + error
Y =
afhankelijke variabele: is de variabelen waarover we iets willen zeggen. -> afhankelijke variabelen.
X=
predictor: de variabele waarover we informatie hebben.
waarom hebben de variabelen een andere naam bij regressie?
omdat ze een andere betekenis hebben
b0 =
b0 = constante of intercept: de waarde van Y als X gelijk is aan 0
b1 =
richtingscoëfficiënt: het verschil van waarde in Y wanneer X1 groter wordt. Dus de verandering in y als x1 groter wordt.
beschrijving
Je gaat bij een groep respondenten informatie verzamelen over X en Y-> over beide variabelen. Je kunt dit is een spreidingsdiagram weergeven en er vervolgens een lijn doorheen tekenen. De lijn heeft een bepaalde intercept en richtingcoëfficiënt.
o Beschrijving kan altijd, of je error nu groot of klein is
error
het verschil tussen de lijn en de punten. er kan een lijn worden getekend maar die lijn is niet perfect. in alle gevallen dat de samenhang niet perfect is, is er een sprake van een error. Error heeft andere namen: residue, voorspellingsfout.
hoe groter dit verschil, hoe groter de error/residue
voorspelling
informatie verzamelen over X bij een onderzoeksgroep, op basis van deze getallen van X een voorspelling doen over wat wij verwachten dat Y score zal zijn. Om een voorspelling te kunnen doen moet er eerst bij een bepaalde groep zowel info over X als Y verzameld zijn.
o Is alleen zinvol als je error klein is. Als het te groot is, is de kans te groot dat het verkeerd is.
formule beschrijving en voorspelling
- beschrijving: Y = b0 + b1∙X + error
- Ŷ = b0 + b1∙X
waarom is een voorspelling handig
voorspelling is handig omdat je alvast actie kunt ondernemen. Ook als het moeilijk is om Y te berekenen is het een voordeel dat als we weten wat x is, we een voorspelling kunnen doen over Y. Dan hoeven de onderzoekers en de respondenten daar niet zoveel tijd in te stoppen, niet vervelend voor de respondenten. voorspelling kan dus handig zijn over tijd en wanneer het vervelend/moeilijk is om die Y te bepalen maar we daar wel iets over willen zeggen.
B0 = intercept vind je in de tabel bij
constant
B1= richtingscoëfficiënt
vind je onder constant bij de naam van de variabelen