Enkelvoudige lineaire regressie - week 2 Flashcards
Regressieanalyse
= op zoek naar (causale) relaties of samenhang tussen X en Y. Relaties tussen afhankelijke en onafhankelijke variabele
enkelvoudige regressie
= met 1x variabele die de y variabele voorspelt
regressielijn
= vat relatie samen tussen x en y. Geeft weer hoe y varieert als x verandert
OLS
= ordinary least squares, kleinste kwadraten methode. minimaliseren van de som van gekwadrateerde residuen
Residuen
= het verschil tussen je geobserveerde waarde (datapunt) minus je schatting op basis van je regressielijn
Interpoleren
= voorspelling maken voor waarden van x die binnen domein steekproef vallen
extrapoleren
= voorspellingen doen voor waarden van x die je niet hebt gemeten in je steekproef. IS risicovol, rare uitkomsten krijgen die niet reëel zijn
Hoe breder het voorspelinterval..
hoe minder nauwkeurig je voorspellingen zijn
R2
= een maat voor voorspelkracht
Max R2 = 1 (zeer sterk verband tussen X en Y)
Min R2 = 0 (geen verband tussen X en Y)
Toets significante samenhang variabele
= t-toets
Toets voor het gehele model
= F-toets
Variantie van residuen in de steekproef neemt toe
Als de variantie van de residuen toeneemt, dan neemt de nauwkeurigheid van de schatting af
Variantie van X in de steekproef neemt toe
Meer verschillen in x-waarde in de steekproef, dan wordt de schatting/voorspelling nauwkeuriger. We hebben immers meer variantie/verschillen
Aantal waarnemingen in de steekproef neemt toe
Aantal waarnemingen neemt toe, residuen nemen af, nauwkeurigheid neemt toe
T- toets
= tweezijdige toets (altijd neg en pos waarde)