ch4 Flashcards
wanneer maak je gebruik van regressie? en wat is het verschil met correlationeel onderzoek
Als er sprake is van interval/ratio meetniveau en een lineaire samenhang.
Correlatie beschrijft alleen de samenhang tussen 2 variabelen met regressie kun je ook uitrekenen wat de verandering van een variabele betekend voor bijvoorbeeld het streefgewicht.
Bij regressie kun je de samenhang beschrijven aan de hand van een rechtte lijn (als er sprake is van lineaire samenhang), bij correlationeel kun je ook iets met een niet-lineaire samenhang.
Least squares lijn
de lijn die het best past bij de data wordt gekozen. SPSS rekent dit uit door de least squares lijn te kiezen, dit is de lijn met het kleinste verschil tussen de lijn en de punten in een spreidingsdiagram.
dus het is een rechtte lijn om de samenhang tussen 2 interval/ratio variabelen te beschrijven.
hoe bereken je enkelvoudige regressie?
- Dit kan met een lineaire formule.
- Rechte lijn om de samenhang tussen twee interval/ratio variabelen te beschrijven
Y = b0 + b1 ∙X + error
Y =
afhankelijke variabele: is de variabelen waarover we iets willen zeggen. -> afhankelijke variabelen.
X=
predictor: de variabele waarover we informatie hebben.
waarom hebben de variabelen een andere naam bij regressie?
omdat ze een andere betekenis hebben
b0 =
b0 = constante of intercept: de waarde van Y als X gelijk is aan 0
b1 =
richtingscoëfficiënt: het verschil van waarde in Y wanneer X1 groter wordt. Dus de verandering in y als x1 groter wordt.
beschrijving
Je gaat bij een groep respondenten informatie verzamelen over X en Y-> over beide variabelen. Je kunt dit is een spreidingsdiagram weergeven en er vervolgens een lijn doorheen tekenen. De lijn heeft een bepaalde intercept en richtingcoëfficiënt.
o Beschrijving kan altijd, of je error nu groot of klein is
error
het verschil tussen de lijn en de punten. er kan een lijn worden getekend maar die lijn is niet perfect. in alle gevallen dat de samenhang niet perfect is, is er een sprake van een error. Error heeft andere namen: residue, voorspellingsfout.
hoe groter dit verschil, hoe groter de error/residue
voorspelling
informatie verzamelen over X bij een onderzoeksgroep, op basis van deze getallen van X een voorspelling doen over wat wij verwachten dat Y score zal zijn. Om een voorspelling te kunnen doen moet er eerst bij een bepaalde groep zowel info over X als Y verzameld zijn.
o Is alleen zinvol als je error klein is. Als het te groot is, is de kans te groot dat het verkeerd is.
formule beschrijving en voorspelling
- beschrijving: Y = b0 + b1∙X + error
- Ŷ = b0 + b1∙X
waarom is een voorspelling handig
voorspelling is handig omdat je alvast actie kunt ondernemen. Ook als het moeilijk is om Y te berekenen is het een voordeel dat als we weten wat x is, we een voorspelling kunnen doen over Y. Dan hoeven de onderzoekers en de respondenten daar niet zoveel tijd in te stoppen, niet vervelend voor de respondenten. voorspelling kan dus handig zijn over tijd en wanneer het vervelend/moeilijk is om die Y te bepalen maar we daar wel iets over willen zeggen.
B0 = intercept vind je in de tabel bij
constant
B1= richtingscoëfficiënt
vind je onder constant bij de naam van de variabelen
goodness- of - fit
er is een regressielijn getekend en de regressievergelijking opgesteld (door een formule). hiervoor is de best passende lijn gekozen. Je gaat kijken hoe goed dit past. Je gaat kijken of de punten dicht bij elkaar liggen of ver uit elkaar liggen. Hiervoor wordt de standaardschattingsfout gebruikt
standdaardschattingsfout
standdaardschattingsfout is de gemiddelde schattingsfout, dus het gemiddelde verschil tussen de werkelijke en voorspelde score. Dit wordt voor iedereen uitgerekend vervolgens berekend SPSS het gemiddelde hiervan. Dit heet de Stdd error of the estimate. Dit vind je in de model summary tabel. Dit betekend dat we er gemiddeld een bepaalde waarde naast zitten.
Stdd error of the estimate.
standdaardschattingsfout
waar vind je de Stdd error of the estimate.
Dit vind je in de model summary tabel.
wat betekend de Stdd error of the estimate.
Dit betekend dat we er gemiddeld een bepaalde waarde naast zitten.
wat is bij regressie in de hypothese toets
de richtingscoëfficiënt
wat toetsen we bij regressie?
is de richtingscoëfficiënt significant kleiner/groter of anders aan 0?
wat zijn de assumpties bij regressie?
- Lineaire samenhang tussen predictor en afhankelijke variable -> geen duidelijke kromme lijn ziet dan is het lineair.
- Geen uitschieters (die teveel invloed hebben). Een uitschieter die een beetje uitschiet heeft weinig/geen invloed op de conclusies.
- Predictoren en afhankelijke variabele minimaal interval meetniveau
- De predictoren mogen onderling niet teveel samenhangen
- Spreiding van residuen per x-waarde gelijk (homoscedasticity)-> de punten moetenn ongeveer even veel van elkaar afliggen van de regressielijn
onafhankelijke variabele
predictor
homoscedasticiteit
om deze assumptie te controleren kan spss dit uitrekenen en een residuenplot maken. Je voldoet aan de voorwaarde als alle punten gelijkmatig over het plaatje zijn verdeeld. Als je niet voldoet aan deze assumptie dan gaan inschatten hoe erg dit is voor je conclusie.
toetsingsgrootheid regressie
Niet alle statistische maten kun je vertalen naar een toetsingsgrootheid. De meeste maten moeten worden omgerekend naar een standaardmaat. Hier wordt de richtingscoëfficiënt b omgerekend naar t-waarde. Bij regressie is er geen steekproefverdeling, hiervoor wordt de t-waarde gebruikt. Dus de toetsingsgrootheid wordt omgerekend naar t-waarde want dan kun je de steekproevenverdeling gebruiken.
Op basis van de t-waarde wordt de p-waarde berekend.
p-waarde regressie
SPSS rekent altijd een tweezijdige p-waarde uit bij regressie. de p-waarde moet daarom bij enkelvoudige regressie gedeeld worden door twee.
Daarnaast wordt op basis van de t-waarde de p-waarde berekend.
de p-waarde kan nooit 0 zijn.
wat is anders bij stap 5 tussen regressie en correlationeel
regressie heeft geen officiele maat voor effectgrootte
significantieniveau
dit is de grenswaarde om te beslissen welke hypothese het meest waarschijnlijk is