bivariate regressie Flashcards

1
Q

verschil bivariate regressie en pearson r correlatie

A

correlatie: niet causaal
regressie: verklaart x y?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

definitie regressieanalyse

A

Onderzoekt de invloed van 1 of meer onafhankelijke variabelen (X: kwalitatief óf continu) op 1 afhankelijke variabele (Y: continu)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

correlatie en bivariate regressie: similarity

A
  • beiden gaan uit van een lineair verband
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

wat weet je over de grafiek van de volgende lineaire formule:
2.05 + 0.37x

A
  • de punten zijn geobserveerde scores
  • de lijn is de voorspelde waarde van Y
  • Residu is de afstand tussen de lijn en het geobserveerde punt
  • 0.37 is de coefficiënt
  • horizontaal zou betekenen: geen effect
  • regressiecoefficient die dicht bij 0 liggen –> er is geen effect
  • 2.05 is de intercept of constante
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

regressie lijn die het best … :

A
  • aansluit bij de puntenwolk
  • Y kan voorspellen
  • waarbij de fout die we maken in voorspelling van Y zo klein mogelijk is
  • alle punten samenvat
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Ordinary Least Squares (OLS)

A

schattingsprocedure, formules om b0 en b te berekenen
–> geven de regressievergelijking waarvoor de som van de gekwadrateerde verschillen tussen de geobserveerde Y en de voorspelde Y minimaal zijn

∑(Y-Y’)^2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

voorspellingsfout/residu

A

Yi-Yi’ –> van case i
- berekenbaar voor elk punt
voorspellingsfout = geobserveerde waarde - voorspelde waarde
= deviatiescore

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Formules om b en b0 te berekenen

A

b= regressiecoefficient

b= r*(Sy/Sx)
–> b= NIET gestandaardiseerd
S= standaard deviatie
b0= intercept, constante

b0=My - bMx

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

voorbeeld:
formule: commitment = 2.046 + .369X
voorspelde waarde (nice leader) = 5
geobserveerde waarde (commitment, ID 20) = 2.5
wat is de voorspellingsfout

A

2.046 + .369*5 = 3.891
2,5 - 3.891 = -1.391

geobserveerd (Y) - voorspeld (Y’)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

verschil residu , effect en totale deviatie

A

Residu: verschil tussen voorspelde y waarde en geobserveerde y waarde

effect: verschil tussen voorspelde y waarde en gemiddelde y waarde

Totale deviatie : verschil tussen geobserveerde y waarde en gemiddelde y waarde

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Formule Sums of Squares

A

SStotal = SSresidual + SSregression
∑(Yi-My)^2=∑(Yi-Yi’)^2 + ∑(Yi’ - My)2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

wat is de effect size in een regressie analyse

A

R^2 = SSregression: SStotal

= proportie verklaarde variantie in Y door X

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

wat is de Fit van een regressie analyse

A

multipele R

= correlatie tussen geobserveerde Y scores en voorspelde Y scores
(= pearson’s r)
–> kwadrateren van multipele R vormt de R^2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

We kunnen toetsen of multiple R significant afwijkt van 0

Hoe?

A

H0: R = 0 / H0: R^2 = 0

dmv F-ratio test statistic

F waarde > kritieke waarde ? verwerpen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

wat is de standard error of the estimate ?

A

standaarddeviatie van de residuen

geeft informatie over typische grootte van voorspellingsfouten

het liefst zo KLEIN mogelijk

Hoe correcter de voorspelling, hoe groter de R, hoe kleiner de standard error of the estimate

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

wat zijn de stappen om individuele regressiecoefficient op significantie te toetsen

A
  1. alfa niveau bepalen
  2. bereken t-ratio test statistic

t= sample statistic - hypothesized parameter
————————————————————-
SEsamplestatistic

t = b - 0
——–
SEb

met df = N-2

= De schatting van de regressie coeff zoals in je steekproef aangetroffen - de verwachte waarde van de 0 hypothese / standaard error
zoek op tvalue in de appendix tabel en vergelijk weer met kritieke waarde

17
Q

verschil tussen gestandaardiseerde regressiecoëfficiënten β en ongestandaardiseerde regressiecoëfficiënt b

A

β: interpretatie in eenheden van standaard-deviatie
“Als X met 1 standaard-deviatie verandert, verandert Y met β standaard-deviaties”

b: interpretatie in originele meeteenheden van X en Y
“Als X met 1 eenheid verandert, verandert Y met b eenheden”

18
Q

Wanneer mag je gestandaardiseerde regressiecoëfficiënten interpreteren?

A
  1. Alleen interessant bij multipele regressie met meerdere CONTINUE onafhankelijke variabelen
  2. Alleen als je de directe effecten van 2 of meer CONTINUE ONafhankelijke variabelen in dezelfde steekproef met elkaar wilt vergelijken qua sterkte
19
Q

WAAROM centreren op het algemene gemiddelde?

A

Om een logische en empirisch waarneembare voorspelde waarde te verkrijgen als we de intercept/constante van een regressievergelijking interpreteren

20
Q

WANNEER centreren op het algemene gemiddelde?

A
  1. Als de X-waarde 0 empirisch niet voor kan komen
    vb. een onderzoek met leeftijd 18+
  2. Als de intercept een waarde voorspelt die niet logisch is of niet empirisch voorkomt
    vb. Empirisch bereik van een afhankelijke variabele is 0-10 in de data, maar we de voorspelde waarde als X=0 is -1.29; voorspelt agressief gedrag van een kind als leeftijd = 0
21
Q

Wat gebeurt er als je een onafhankelijke variabele X centreert op het gemiddelde?

A
  1. Centreren op het algemene gemiddelde verandert de interpretatie van de intercept: in plaats van de betekenis
  2. ‘voorspelde waarde van Y als X gelijk is aan het gemiddelde van X’
  3. Noch de schatting van het effect van X op Y, noch de bijbehorende standaardfout veranderen door centreren
  4. Je ziet dan je gemiddelde als nieuwe 0-punt
22
Q

HOE centreer je een onafhankelijke variabele X?

A
  1. bereken het gemiddelde van X –> Xmean
  2. Bereken als volgt een nieuwe variabele Xcentered:
    compute Xcentered = X - Xmean
    –> gecentreerde variabele stop je in de regressie

af te lezen in SPSS in de rechter coefficient tabel
–> andere intercept –> kleinere standaardfout

23
Q

vul in:

“we regress the ____ variable __ on the ____ variable __”
“regressing __ on __”

A
  1. dependent, Y - independent, X
  2. Y, X
24
Q

hoe verschillen pearson’s r en de bivariate regressie
–> symmetrie

A

pearson’s r: symmetrisch
bivariate regressie: hoeft niet symmetrisch te zijn

25
Q

wat zijn de overeenkomsten tussen pearson’s r en bivariate regressie?

A
  1. In een bivariate regressie analyse is R gelijk aan r
  2. In een bivariate regressie analyse is r gelijk aan de gestandaardiseerde regressiecoefficient β
  3. in een multipele regressie analyse is R ongelijk aan r