Thema 5 Flashcards

Question

Enkelvoudige regressieanalyse

Answer 1

A

instrument voor onderzoekers waarmee op basis van de waarde op de ene variabele, een voorspelde waarde op de andere variabele berekend kan worden ( en geeft indruk van accuraatheid van voorspelling)

1) hoe vinden we de beste lijn in een willekeurige puntenwolk?
2) hoe goed past deze lijn bij de data?

predictor variabele
afhankelijke variabele

Answer 2

A

regressielijn is het product van regressieanalyse

minder steile lijn = minder sterk verband
hoe goed de voorspellingen zijn hangt af van de afstand tussen de geobserveerde waarden en de voorspelde waarden
de regressielijn moet zó lopend dat de afwijking tuussen elke geobserveerde Y-score en de corresponderende voorspelling zo klein mogelijk is
de regressieanalyse is een methode om de lijn te vinden waarbij de (gekwadrateerde) afwijkingen geminimaliseerd owrden.
De uitkomst zijn 2 getallen die de lijn beschrijven; de regressie coëfficiënten (bèta’s)

Answer 3

A

Intercept

Answer 4

A

het berekenen van voorspellingen van een model voor waarden buiten het bereik van de data waarop dat model gebaseerd is

Answer 5

A

het gebruik van een model om tussenliggende waarden te berekenen

Answer 6

A

dit 2e regressiecoëfficiënt is de helling van de lijn. eze geeft de stijging of daling in de variabele op de y-as aan als de variabele op de x-as met 1 eenheid toeneemt

Answer 7

A

Afhankelijke variabele

Answer 8

A

onafhankelijke variabele (vanuit dit gegeven wil ik voorspellen)

Answer 9

A

om deze als intervalvariabele mee te nemen in de regressieanlayse, moeten beide waarden een getal hebben.

het representeren van de meetwaarden van een categorische variabele met getallen heet “Dummycoderen”
Bij een dichtome voorspeller is de regressie coefficient van de helling het verschil tussen gemiddelden in de 2 groepen
als we het verschil tussen de gemiddelden delen door de bijbehorende standaardfout krijgen we een t-waarde en hiermee kunnen we een p-waarde berekenen

Answer 10

A

Correlatie Coëfficiënten zijn effectgroottes die gekwadrateerd kunnen worden om een schatting te krijgen van de populatie verklaarde variantie (R2) (dwz hoeveel variabelen overlappen)

Regressieanalyse produceert een regressie vergelijking: een model waarmee -gegeven een waarde op de ene variabele - de waarde op een andere variabele voorspeld kan worden.

Anders dan een correlatieanalyse is regressie analyse asymmetrisch; omdat de waarde van de ene variabele voorspeld wordt met de andere, maakt de schaalverdeling van elke variabele uit.

Answer 11

A

per definitie afkomstig uit een zogenaamde steekproevenverdeling die alle mogelijke waarden voor een maat bevat. Hetzelfde geldt voor correlaties.

Answer 12

A

T-Verdeling is variatie op Z-verdeling

T-verdeling wordt niet opgesteld voor een gegeven steekproefomvang, maar voor een gegeven aantal vrijheidsgraden (Df).

Bij de berekening van de variantie (Mean Squares MS) wordt de variatie (Sum of Squares SS) gedeeld door het aantal vrijheidsgraden van die variatie

op die zelfde manier heeft een regressiecoeefficient vrijheidsgraden en die zijn gelijk aan het aantal deelnemers in de steekproef min het totale aantal regressiecoefficienten.

Answer 13

A

Wordt bepaald door standaarddeviatie
_ Z-waarde van 1 correspondeert met een afwijking van 1 stndaarddeviatie vanuit het midden van de verdeling
- Z-waarde = T-waarde met standaardfout

Answer 14

A

dit betekent dat het betrouwbaarheidsinterval van een regressiecoefficient eenvoudig berekend kan worden als de bijbbehorende standaardfout bekend is.

Answer 15

Study These Flashcards

A

geínterpreteerd als aanwijzing dat het verband waar die P-waarde betrekking op heeft, in de populatie ongelijk is aan 0.

Answer 16

Study These Flashcards

A

OLS

Answer 17

Study These Flashcards

A

deze kans is de P-waarde die bij de berekende F-waarde hoort

Answer 18

Study These Flashcards

A

= de standaardeviatie van de steekproevenverdeling)
- geeft informatie voer hoe accuraat de schattingen van de regressie coeffficienten zijn.

Answer 19

Study These Flashcards

A

1) van elk datapunt wordt het gemiddelde van de betreffende variabele afgetrokken
2) elk datapunt gedeeld door de standaardeviatie van de betreffende variabele
3) daarna wordt regressieanalyse herhaald met die nieuwe variabelen
(maakt de schaalverdeling van alle variabelen aan elkaar gelijk)

-elke gestandaardiseerde variabele heeft een gemiddelde van 0 en een standaarddeviatie van 1 (toename 1 is toename 1 standaarddeviatie)

deze standaardisatie vindt ook plaats voor de afhankelijke variabele. De gestandaardiseerde hellingscoefficient drukt daardoor altijd uit hoeveel standaarddeviaties de afhankelijke variabele verandert (stijgt) als de voorspeller met precies één standaarddeviatie toeneemt.

Answer 20

Study These Flashcards

A

eerste stap standaardisatie (trek gemiddelde van elk datapunt af)
hiermee verandert de schaalverdeling van de variabele niet, enige gevolg is dat het gemiddelde - na centreren - geijk is aan 0

als je met een gecentreerde variabele een regressieanalyse doet, is de hellingscoefficient hetzelfde, maar het intercept verandert
de waarde van het intercept wordt dan gelijk aan de voorspeldde waarde van de afhankelijke variabele voor iemand met de gemiddelde score op deze voorspeller

Answer 21

Study These Flashcards

A

error (ruis) in de afhankelijke variabele zit

omdat er bij enkelvoudige regressie maar één predictor (onafhankelijke variabele) is, geldt dat de zogenaamde Multiple Correlatie (R) gelijk is aan de gewone correlatie tussen de 2 variabelen (r) en dus is de proportie verklaarde variantie (R2) gelijk aan (r2)

(welke variabele je ook specificeert alls voorspeller/criterium = proportie verklaarde variantie hetzelfde)

Answer 22

Study These Flashcards

A

de correlatiecoefficient die bij correlaties wordt berekend is identiek aan de gestandaardiseerde regressiecoefficient van de predictor in regressieanalyse (de bèta)
Ook de P-waarde behorende bij de correlatie en die van de predictor zijn identiek (altijd bij bivariate-enkelvoudige regressieanalyses)

Answer 23

Study These Flashcards

A

de 1e 4 harde aannames, als deze worden geschonden is het regressiemodel het verkeerde model. Bij schending neemt de zuiverheid van de schattingen van de regressiecoefficienten en de proportie verklaarde variantie af.
Bij schending 5e/zachte aanname neemt de accuraatheid van de schattingen de regressiecoefficientten en de proportie verklaarde variantie af (meer datapunten nodig

Thema 5 Flashcards

(25 cards)