Chapter 3.3 en 3.4 Flashcards
the regression line predicts..
the value for the response variable y as a straight line function of the value x of the explanatory variable.
dus welke is y
y = response variable/dependent
en welke is x
x = explanatory variable/independent
wat is ŷ
the predicted value of y
a =
y-intercept
b=
slope
wat is de formule bij de regressielijn
ŷ = a +bx
hoe bereken je y intercept
y aflezen when x=0
slope berekenen
verandering in y / verandering in x
(rise/run)
when the slope is negative…
ŷ decreases when x increases
hoe zie je dat je een steilere regression lijn hebt
als de slope meer negatief of positief is (2 is stijler dan 0,5)
residuals heten ook wel de
…
the prediction errors: hoe ver een datapunt van de regressielijn afvalt.
every value has a residual
oke
positive residual
when y - ŷ > 0. dus actual y is larger than predicted ŷ
negative residual
when y - ŷ < 0. dus actual y is smaller than predicted ŷ
hoe beter de prediction…
hoe kleiner de residual (want ligt dan dichter bij de voorspelde waarde)
hoe zie je een residual in een scatterplot
de vertical distance between data point and line = absolute value.
over welke variabele gaat de residual?
de response variable!
residual formule
y - ŷ
hoe moet je een lijn selecteren
met least squares method (de lijn die gemiddeld de minste afstand heeft tussen de punten en de lijn)
evalueren van de regressielijn met de…
residual sum of squares method:
∑( y - ŷ ) ^2
-> hoe kleiner deze waarde is, hoe beter de lijn!
drie eisen van de regressielijn
- minste afstand (dus kleinste residual sum of squares)
- heeft positieve en negatieve waardes, bij elkaar opgeteld = 0
- passes through the point of ( x̄ ; ȳ ) -> dus gaat door de gemiddelden heen van beide de x en y as.
b = (formule)
b = r * (sx/sy)
y intercept = (formule)
a = ŷ - b*(x̄)