Thema 5 Flashcards

1
Q

Regressieanalyse

A

instrument voor onderzoekers waarmee op basis van de waarde op de ene variabele, een voorspelde waarde op de andere variabele berekend kan worden ( en geeft indruk van accuraatheid van voorspelling)

1) hoe vinden we de beste lijn in een willekeurige puntenwolk?
2) hoe goed past deze lijn bij de data?

  • predictor variabele
  • afhankelijke variabele
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Een regressielijn geeft de beste voorspelling weer van de ene variabele door de andere variabele

A

regressielijn is het product van regressieanalyse

  • minder steile lijn = minder sterk verband
  • hoe goed de voorspellingen zijn hangt af van de afstand tussen de geobserveerde waarden en de voorspelde waarden
  • de regressielijn moet zó lopend dat de afwijking tuussen elke geobserveerde Y-score en de corresponderende voorspelling zo klein mogelijk is
  • de regressieanalyse is een methode om de lijn te vinden waarbij de (gekwadrateerde) afwijkingen geminimaliseerd owrden.
    De uitkomst zijn 2 getallen die de lijn beschrijven; de regressie coëfficiënten (bèta’s)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Het 1e getal uit de regressieanalyse is simpelweg de voorspelling voor iemand die 0 scoort op de predictorvariabele, of wel een waarde van 0 op de x-as

A

Intercept

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Extrapolatie

A

het berekenen van voorspellingen van een model voor waarden buiten het bereik van de data waarop dat model gebaseerd is

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Interpolatie

A

het gebruik van een model om tussenliggende waarden te berekenen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Regressie Coëfficiënt (helling)

A

dit 2e regressiecoëfficiënt is de helling van de lijn. eze geeft de stijging of daling in de variabele op de y-as aan als de variabele op de x-as met 1 eenheid toeneemt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

criterium

A

Afhankelijke variabele

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Covariaat (regressiecontext)

A

onafhankelijke variabele (vanuit dit gegeven wil ik voorspellen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Een dichotome voorspelle kan maar 2 waarden aannemen

A

om deze als intervalvariabele mee te nemen in de regressieanlayse, moeten beide waarden een getal hebben.

  • het representeren van de meetwaarden van een categorische variabele met getallen heet “Dummycoderen”
  • Bij een dichtome voorspeller is de regressie coefficient van de helling het verschil tussen gemiddelden in de 2 groepen
  • als we het verschil tussen de gemiddelden delen door de bijbehorende standaardfout krijgen we een t-waarde en hiermee kunnen we een p-waarde berekenen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Enkelvoudige regressieanalyse is een uitbreiding van bivariate correlaties naar een voorspellingsmodel

A

Correlatie Coëfficiënten zijn effectgroottes die gekwadrateerd kunnen worden om een schatting te krijgen van de populatie verklaarde variantie (R2) (dwz hoeveel variabelen overlappen)

Regressieanalyse produceert een regressie vergelijking: een model waarmee -gegeven een waarde op de ene variabele - de waarde op een andere variabele voorspeld kan worden.

Anders dan een correlatieanalyse is regressie analyse asymmetrisch; omdat de waarde van de ene variabele voorspeld wordt met de andere, maakt de schaalverdeling van elke variabele uit.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

De proportie verklaarde variantie, ofwel R2 is bij enkelvoudige regressie analyse gelijk aan het kwadraat van de correlatie tussen de 2 variabelen in het regressiemodel

A

R2 = r2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Voor beschrijvingsmaten (mediaan, variantie en spitsheid van een verdeling) zijn de getallen die in een willekeurige steekproef worden gevonden

A

per definitie afkomstig uit een zogenaamde steekproevenverdeling die alle mogelijke waarden voor een maat bevat. Hetzelfde geldt voor correlaties.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

De steekrpoevenverdeling van B0 en B1 = de T-verdeling

A

T-Verdeling is variatie op Z-verdeling

T-verdeling wordt niet opgesteld voor een gegeven steekproefomvang, maar voor een gegeven aantal vrijheidsgraden (Df).

Bij de berekening van de variantie (Mean Squares MS) wordt de variatie (Sum of Squares SS) gedeeld door het aantal vrijheidsgraden van die variatie

  • op die zelfde manier heeft een regressiecoeefficient vrijheidsgraden en die zijn gelijk aan het aantal deelnemers in de steekproef min het totale aantal regressiecoefficienten.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Z-Verdeling (breedte van de normaalverdeling)

A

Wordt bepaald door standaarddeviatie
_ Z-waarde van 1 correspondeert met een afwijking van 1 stndaarddeviatie vanuit het midden van de verdeling
- Z-waarde = T-waarde met standaardfout

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

anders dan de steekproevenverdeling van Pearson’s R is de T-verdeling de steekproevenverdeling van regressiecoefficienten, Symmetrisch

A

dit betekent dat het betrouwbaarheidsinterval van een regressiecoefficient eenvoudig berekend kan worden als de bijbbehorende standaardfout bekend is.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Binnen het kader van de nulhypothese significantietoetsing worden p-warden lager dan 5

A

geínterpreteerd als aanwijzing dat het verband waar die P-waarde betrekking op heeft, in de populatie ongelijk is aan 0.

17
Q

Ordinary Least Squares

A

OLS

18
Q

De F-verdeling wordt gebruikt om te beoordelen hoe groot de kans op R2 is, als er in de populatie geen verband is tussen de voorspeller en de afhankelijke variabele

A

deze kans is de P-waarde die bij de berekende F-waarde hoort

19
Q

StandaardFout/Error (SE)

A

= de standaardeviatie van de steekproevenverdeling)
- geeft informatie voer hoe accuraat de schattingen van de regressie coeffficienten zijn.

20
Q

Om gestandaardiseerde regressie coefficienten te berekenen voert een statistisch programma 3 handelingen uit

A

1) van elk datapunt wordt het gemiddelde van de betreffende variabele afgetrokken
2) elk datapunt gedeeld door de standaardeviatie van de betreffende variabele
3) daarna wordt regressieanalyse herhaald met die nieuwe variabelen
(maakt de schaalverdeling van alle variabelen aan elkaar gelijk)

-elke gestandaardiseerde variabele heeft een gemiddelde van 0 en een standaarddeviatie van 1 (toename 1 is toename 1 standaarddeviatie)

  • deze standaardisatie vindt ook plaats voor de afhankelijke variabele. De gestandaardiseerde hellingscoefficient drukt daardoor altijd uit hoeveel standaarddeviaties de afhankelijke variabele verandert (stijgt) als de voorspeller met precies één standaarddeviatie toeneemt.
21
Q

Centreren

A

eerste stap standaardisatie (trek gemiddelde van elk datapunt af)
hiermee verandert de schaalverdeling van de variabele niet, enige gevolg is dat het gemiddelde - na centreren - geijk is aan 0

  • als je met een gecentreerde variabele een regressieanalyse doet, is de hellingscoefficient hetzelfde, maar het intercept verandert
  • de waarde van het intercept wordt dan gelijk aan de voorspeldde waarde van de afhankelijke variabele voor iemand met de gemiddelde score op deze voorspeller
22
Q

de Asymmetrie zit em erin dat de regressieanalyse anneemt dat alle

A

error (ruis) in de afhankelijke variabele zit

  • omdat er bij enkelvoudige regressie maar één predictor (onafhankelijke variabele) is, geldt dat de zogenaamde Multiple Correlatie (R) gelijk is aan de gewone correlatie tussen de 2 variabelen (r) en dus is de proportie verklaarde variantie (R2) gelijk aan (r2)

(welke variabele je ook specificeert alls voorspeller/criterium = proportie verklaarde variantie hetzelfde)

23
Q

Correlatie en regressie lijken op elkaar, maar regressieanalyse gaat verder;

A

de correlatiecoefficient die bij correlaties wordt berekend is identiek aan de gestandaardiseerde regressiecoefficient van de predictor in regressieanalyse (de bèta)
Ook de P-waarde behorende bij de correlatie en die van de predictor zijn identiek (altijd bij bivariate-enkelvoudige regressieanalyses)

24
Q

In een enkelvoudige regressieanalyse worden 5 aannames gemaakt

A
  • de 1e 4 harde aannames, als deze worden geschonden is het regressiemodel het verkeerde model. Bij schending neemt de zuiverheid van de schattingen van de regressiecoefficienten en de proportie verklaarde variantie af.
  • Bij schending 5e/zachte aanname neemt de accuraatheid van de schattingen de regressiecoefficientten en de proportie verklaarde variantie af (meer datapunten nodig
25
Q

Enkelvoudige regressieanalyse

A