Correlatie en regressie Flashcards

1
Q

covariantie

A

relatie tussen twee variabele. Met variantie wordt de standaard spreiding van de betrokken waarden berekend.
Waarde zit altijd tussen -1 en 1.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
1
Q

positieve covariantie

A

beide variabele in dezelfde richting verschillen van de mean

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

negatieve covariantie

A

ene variabele boven en de ander onder de mean.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Correlatie

A

standaardiseren van de covariantie met behulp van de standaarddeviatie.
relatie van twee variabelen met elkaar.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Pearson correlatie coëfficiënt, r

A

ligt tussen -1 en +1, met r=0 is geen verband.
Grootte van effect: r = 0.1 is klein, r = 0.3 is medium, r = 0.5 is groot.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Bivariate correlatie

A

correlatie tussen twee variabelen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Partiële relatie

A

kijkt naar de relatie tussen twee variabelen terwijl men het effect van een of meerdere bijkomende variabelen ‘controleert’

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Correlatie SPSS

A

analyze > correlate > bivariate
Uitkomst: correlatiematrix
NB: maakt altijd een scatterplot

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

correlatiecoëfficient

A

mate van significantie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Bivariate correlatietest SPSS

A

Analyse > correlate > bivariate > correlation coefficient > test of significance > options

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Non-parametrische toets

A

Gebruikt wanner:
- niet aan eisen normaliteit is voldaan
- weinig gegevens of gegevens met uitschieters
Spearman’s en Kendall’s tau kunnen worden gebruikt als correlatiecoëfficiënten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Biseriële en punt-biseriële correlatie

A

wanneer een van de twee variabelen dichotoom is. Dichotome variabele discreet of continu. Point wordt berekent met Pearson’s r.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Regressieanalyse

A

voorspellen van uitkomstvariabele uit voorspellende variabele
- simpele regressie: een voorspellende variabele
- Multiple regressie: eerder voorspellende variabelen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

residu

A

verschil tussen wat het model voorspelt (regressielijn) en de geobserveerde data (punten); afwijkingen in het model

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Residual sum of squares, SSr

A

verschil tussen geobserveerde data en regressielijn; geeft een maat aan voor onnauwkeurigheid wanneer de best passende lijn wordt gebruikt als model

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Total sum of squares, SST

A

verschil tussen geobserveerde data en gemiddelden waarden van de data.

16
Q

Model sum of squares, SSm

A

verschil tussen SSt (regressielijn) en SSr (gemiddeld waarden data) en geeft de verbetering aan wanneer de SSr wordt gebruikt in plaats van de SST
SSm groot, gemiddelde als model; SSm klein regressielijn als model

17
Q

multiple regression

A

lijkt op simpele regressie, dient alleen voor iedere extra voorspellende variabele een coefficient toegevoegd te worden

18
Q

Generalisatie

A

generaliseren van model op andere samples
- additiviteit en lineariteit
- onafhankelijke errors > Durbin-watson test
- homoscedasticiteit
-normaal verdeelde errors
- voorspellers niet gecorreleerd met externe variabele
- type variabele
- geen perfecte multicollineariteit: voorspellers niet te hoog correleren
- geen variantie van nul

19
Q

Pearson’s r

A

gestandaardiseerde maat. Covariantie is geen standaardmaat en moet worden gestandaardiseerd met behulp van std. Correlatie tussen twee variabele

20
Q

Determinatiecoëfficient (R^2)

A

maat voor hoeveelheid variantie die door een variabele wordt verklaard, die wordt gedeeld door andere variabele. Coefficient geeft percentage verklaarde variantie.

21
Q

Partiele correlatie

A

type correlatie die het mogelijk maakt te kijken naar relatie tussen twee variabele als de effecten van een derde variabele constant worden gehouden.

22
Q

Semi-partiele correlatie

A

alleen controleren voor het effect dat de derde variabele heeft op een andere variabele. Correlatie is bruikbaar wanneer de variantie in een specifiek set van voorspellende variabelen moet worden uitgelegd

23
Q

R^2 pearson

A

verklaarde variantie

24
Q

R^2 van Spearman

A

verdeling van variantie in de ranks de twee variabelen delen
Geen 0 voor komma: r = .87

25
Q

Tau^2

A

geen numerieke variabele: geeft geen informatie over de verdeling van gedeelde variantie van twee variabele.

26
Q

cross-validation

A

bepalen van nauwkeurigheid van het model op verschillende samples. Hiermee kan worden beoordeeld hoe goed het model de uitkomst bij een andere sample voorspelt
- aangepaste R^2: informatie over hoe veel van de variantie Y rekening mee moet worden gehouden wanneer het model afgeleid zou zijn van de populatie waarin de sample is genomen. Deze methode verliest predictie power (shrinkage)
- Data splitten: random splitten van data, regressievergelijking op beide helften uitvoeren en vervolgens vergelijken van modellen.