regression Flashcards
correlation coeffiecient
tussen -1 en 1, zegt iets over de strength of de linear relatie (r). Kan niet exact geven. Zegt iets over hoe sterk het verband is
y intersept
a, de waarde voor y als x is 0
b, hoeveel y verandert als x toeneemt met 1. is de associatie pos of neg, dexcribed the trend. Zegt niks over de strenght, dit doet r
afwijking sample mean, het schat de waarde van de error . Hoe kleiner de waarde, hoe beter de voorspelling is
regressie analyse
analyseren van gegevens met bepaalde samenhang
y dakje
predicted/ voorspelling
het uitbreiden van een reeks getallen met punten die buiten die reeks liggen
voorspellingen over de toekomst ahv time series data
regression outliers
being well removed from the trend
als een obervatie een groot effect heeft op de resultaten van een regression analyse. conditie 1; x waarde is relatief hoog of laag ivm rest van data. 2; het is een regression oulier, valt ver van de trend
these measures are affected by outliers/ skwewness
Lurking variable
3e variabele die niet wordt gemeten in een situatie maar die wel de assosiatie beinvloed tussen response en explenatory
Simpson’s paradox
de direction of an association tussen 2 variabelen kan veranderen nadat 3e varibele erbij is
verschil confound & Lurking variabele
Lurking is not measured in study, it has the potential for confounding
regression line
to predict the response variabele y. Toename of afname variabele
de correlatie is een….
standardized version of the slobe
slobe = r als
sx = sy
regression toward the mean
y is relatief closer to its mean dan x
measures the strengts of linear association. Valt tussen 0 en 1. the proportional decrease in the predicion error =total SS-RSS/total SS. Hoe groter hoe beter, want dan veel decrease in error
ecological fallacy
making predictions about individuals based on the summery results for groups ipv individueel
beschrijft de veranderlijkheid van de sampling verdeling, dit meet hoe de schatting varieert van sample to sample met size n
positive b
b>0, positive association
negative b
b<0, neg association
r2 = 0,114
de variance around the regression line = 11,4% less than the total variance–> 11,4% of the total variance in y is explained by x
assumptions hypothese testing regression
- x en y are linearly related
2. For every value of x, y is normally distributed, with the same standard deviation
als 0 niet in CI
dan kan je zeggen dat er bewijs is voor….