ch4 Flashcards

1
Q

wanneer maak je gebruik van regressie? en wat is het verschil met correlationeel onderzoek

A

Als er sprake is van interval/ratio meetniveau en een lineaire samenhang.
Correlatie beschrijft alleen de samenhang tussen 2 variabelen met regressie kun je ook uitrekenen wat de verandering van een variabele betekend voor bijvoorbeeld het streefgewicht.
Bij regressie kun je de samenhang beschrijven aan de hand van een rechtte lijn (als er sprake is van lineaire samenhang), bij correlationeel kun je ook iets met een niet-lineaire samenhang.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Least squares lijn

A

de lijn die het best past bij de data wordt gekozen. SPSS rekent dit uit door de least squares lijn te kiezen, dit is de lijn met het kleinste verschil tussen de lijn en de punten in een spreidingsdiagram.

dus het is een rechtte lijn om de samenhang tussen 2 interval/ratio variabelen te beschrijven.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

hoe bereken je enkelvoudige regressie?

A
  • Dit kan met een lineaire formule.
  • Rechte lijn om de samenhang tussen twee interval/ratio variabelen te beschrijven

Y = b0 + b1 ∙X + error

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Y =

A

afhankelijke variabele: is de variabelen waarover we iets willen zeggen. -> afhankelijke variabelen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

X=

A

predictor: de variabele waarover we informatie hebben.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

waarom hebben de variabelen een andere naam bij regressie?

A

omdat ze een andere betekenis hebben

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

b0 =

A

b0 = constante of intercept: de waarde van Y als X gelijk is aan 0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

b1 =

A

richtingscoëfficiënt: het verschil van waarde in Y wanneer X1 groter wordt. Dus de verandering in y als x1 groter wordt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

beschrijving

A

Je gaat bij een groep respondenten informatie verzamelen over X en Y-> over beide variabelen. Je kunt dit is een spreidingsdiagram weergeven en er vervolgens een lijn doorheen tekenen. De lijn heeft een bepaalde intercept en richtingcoëfficiënt.
o Beschrijving kan altijd, of je error nu groot of klein is

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

error

A

het verschil tussen de lijn en de punten. er kan een lijn worden getekend maar die lijn is niet perfect. in alle gevallen dat de samenhang niet perfect is, is er een sprake van een error. Error heeft andere namen: residue, voorspellingsfout.
hoe groter dit verschil, hoe groter de error/residue

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

voorspelling

A

informatie verzamelen over X bij een onderzoeksgroep, op basis van deze getallen van X een voorspelling doen over wat wij verwachten dat Y score zal zijn. Om een voorspelling te kunnen doen moet er eerst bij een bepaalde groep zowel info over X als Y verzameld zijn.
o Is alleen zinvol als je error klein is. Als het te groot is, is de kans te groot dat het verkeerd is.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

formule beschrijving en voorspelling

A
  • beschrijving: Y = b0 + b1∙X + error
  • Ŷ = b0 + b1∙X
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

waarom is een voorspelling handig

A

voorspelling is handig omdat je alvast actie kunt ondernemen. Ook als het moeilijk is om Y te berekenen is het een voordeel dat als we weten wat x is, we een voorspelling kunnen doen over Y. Dan hoeven de onderzoekers en de respondenten daar niet zoveel tijd in te stoppen, niet vervelend voor de respondenten. voorspelling kan dus handig zijn over tijd en wanneer het vervelend/moeilijk is om die Y te bepalen maar we daar wel iets over willen zeggen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

B0 = intercept vind je in de tabel bij

A

constant

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

B1= richtingscoëfficiënt

A

vind je onder constant bij de naam van de variabelen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

goodness- of - fit

A

er is een regressielijn getekend en de regressievergelijking opgesteld (door een formule). hiervoor is de best passende lijn gekozen. Je gaat kijken hoe goed dit past. Je gaat kijken of de punten dicht bij elkaar liggen of ver uit elkaar liggen. Hiervoor wordt de standaardschattingsfout gebruikt

17
Q

standdaardschattingsfout

A

standdaardschattingsfout is de gemiddelde schattingsfout, dus het gemiddelde verschil tussen de werkelijke en voorspelde score. Dit wordt voor iedereen uitgerekend vervolgens berekend SPSS het gemiddelde hiervan. Dit heet de Stdd error of the estimate. Dit vind je in de model summary tabel. Dit betekend dat we er gemiddeld een bepaalde waarde naast zitten.

18
Q

Stdd error of the estimate.

A

standdaardschattingsfout

19
Q

waar vind je de Stdd error of the estimate.

A

Dit vind je in de model summary tabel.

20
Q

wat betekend de Stdd error of the estimate.

A

Dit betekend dat we er gemiddeld een bepaalde waarde naast zitten.

21
Q

wat is bij regressie in de hypothese toets

A

de richtingscoëfficiënt

22
Q

wat toetsen we bij regressie?

A

is de richtingscoëfficiënt significant kleiner/groter of anders aan 0?

23
Q

wat zijn de assumpties bij regressie?

A
  1. Lineaire samenhang tussen predictor en afhankelijke variable -> geen duidelijke kromme lijn ziet dan is het lineair.
  2. Geen uitschieters (die teveel invloed hebben). Een uitschieter die een beetje uitschiet heeft weinig/geen invloed op de conclusies.
  3. Predictoren en afhankelijke variabele minimaal interval meetniveau
  4. De predictoren mogen onderling niet teveel samenhangen
  5. Spreiding van residuen per x-waarde gelijk (homoscedasticity)-> de punten moetenn ongeveer even veel van elkaar afliggen van de regressielijn
24
Q

onafhankelijke variabele

A

predictor

25
Q

homoscedasticiteit

A

om deze assumptie te controleren kan spss dit uitrekenen en een residuenplot maken. Je voldoet aan de voorwaarde als alle punten gelijkmatig over het plaatje zijn verdeeld. Als je niet voldoet aan deze assumptie dan gaan inschatten hoe erg dit is voor je conclusie.

26
Q

toetsingsgrootheid regressie

A

Niet alle statistische maten kun je vertalen naar een toetsingsgrootheid. De meeste maten moeten worden omgerekend naar een standaardmaat. Hier wordt de richtingscoëfficiënt b omgerekend naar t-waarde. Bij regressie is er geen steekproefverdeling, hiervoor wordt de t-waarde gebruikt. Dus de toetsingsgrootheid wordt omgerekend naar t-waarde want dan kun je de steekproevenverdeling gebruiken.
Op basis van de t-waarde wordt de p-waarde berekend.

27
Q

p-waarde regressie

A

SPSS rekent altijd een tweezijdige p-waarde uit bij regressie. de p-waarde moet daarom bij enkelvoudige regressie gedeeld worden door twee.
Daarnaast wordt op basis van de t-waarde de p-waarde berekend.
de p-waarde kan nooit 0 zijn.

28
Q

wat is anders bij stap 5 tussen regressie en correlationeel

A

regressie heeft geen officiele maat voor effectgrootte

29
Q

significantieniveau

A

dit is de grenswaarde om te beslissen welke hypothese het meest waarschijnlijk is