Chapter 3.3 en 3.4 Flashcards

1
Q

the regression line predicts..

A

the value for the response variable y as a straight line function of the value x of the explanatory variable.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

dus welke is y

A

y = response variable/dependent

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

en welke is x

A

x = explanatory variable/independent

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

wat is ŷ

A

the predicted value of y

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

a =

A

y-intercept

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

b=

A

slope

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

wat is de formule bij de regressielijn

A

ŷ = a +bx

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

hoe bereken je y intercept

A

y aflezen when x=0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

slope berekenen

A

verandering in y / verandering in x

(rise/run)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

when the slope is negative…

A

ŷ decreases when x increases

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

hoe zie je dat je een steilere regression lijn hebt

A

als de slope meer negatief of positief is (2 is stijler dan 0,5)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

residuals heten ook wel de

A

the prediction errors: hoe ver een datapunt van de regressielijn afvalt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

every value has a residual

A

oke

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

positive residual

A

when y - ŷ > 0. dus actual y is larger than predicted ŷ

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

negative residual

A

when y - ŷ < 0. dus actual y is smaller than predicted ŷ

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

hoe beter de prediction…

A

hoe kleiner de residual (want ligt dan dichter bij de voorspelde waarde)

17
Q

hoe zie je een residual in een scatterplot

A

de vertical distance between data point and line = absolute value.

18
Q

over welke variabele gaat de residual?

A

de response variable!

19
Q

residual formule

A

y - ŷ

20
Q

hoe moet je een lijn selecteren

A

met least squares method (de lijn die gemiddeld de minste afstand heeft tussen de punten en de lijn)

21
Q

evalueren van de regressielijn met de…

A

residual sum of squares method:

∑( y - ŷ ) ^2

-> hoe kleiner deze waarde is, hoe beter de lijn!

22
Q

drie eisen van de regressielijn

A
  • minste afstand (dus kleinste residual sum of squares)
  • heeft positieve en negatieve waardes, bij elkaar opgeteld = 0
  • passes through the point of ( x̄ ; ȳ ) -> dus gaat door de gemiddelden heen van beide de x en y as.
23
Q

b = (formule)

A

b = r * (sx/sy)

24
Q

y intercept = (formule)

A

a = ŷ - b*(x̄)

25
Q

does the slope depend on the numerical values of the variables?

A

yes, daarom niet appropriate voor het geven van de strenght van de relatie

“So the slope b doesn’t tell us whether the association is strong or weak since we can make b as large or as small as we want by changing the units. By contrast, the correlation does not change when the units of measurement change.”

26
Q

dus… verandert de correlatie als we de units veranderen?

A

nee

27
Q

twee overeenkomsten tussen correlation and regression

A
  • je kan ze alle twee gebruiken als het twee kwantitatieve variabelen zijn waar je een rechte lijn door kan trekken.
  • de correlatie en de slope van de regression hebben hetzelfde teken: als de een positief is dan is de andere dat ook, als de een negatief is is de andere dat ook.
28
Q

wat is r2

A

het percentage aan variabiliteit in de response variable dat uitgelegd kan worden door de lineaire relatie tussen x en y.

29
Q

het verschil tussen ŷ en ȳ

A

ŷ = voorspelde waarde van y

ȳ = gemiddelde van y

30
Q

hoe kan je r2 krijgen

A

kwadraat van r (correlatie) nemen.
dit is dus de variabiliteit door de associatie.

31
Q

welke r2 geeft een betere predictie aan?

A

grotere r2 = betere predictie

32
Q

slope = correlation qua sign!!

A

oke

33
Q

extrapolation

A

using the regression line to predict data for x and y that is outside of the available data. (=forecasting)

34
Q

hebben outliers een effect op correlatie en of regressie?

A

ja, op beiden -> nonresistant!

35
Q

lurking variable

A

a variable that is unobserved, that influences the association between the variables of primary interest (vaak meerdere factoren die een invloed hebben!). het gaat hierbij echt om causes.
Dus er lijkt dan een associatie te zijn tussen twee variabelen, maar dat komt eigenlijk door een derde variabele. Deze variabelen worden niet meegenomen in de studie –> hebben dus confounding potential!

36
Q

Simpson’s paradox

A

the direction of an association changes if we add a third variable

37
Q

confounding

A

When two explanatory variables are both associated with a response variable but are also associated with each other, confounding occurs

38
Q

confounding

A

= association met beiden de explanatory en response variable.