H4 Flashcards

1
Q

Regressie analyse

A

Best passende lijn door datapunten zoeken en aan de hand van de lijn een voorspelling doen over de data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Forecasts (voorspellingen

A

Voorspellingen over de toekomst met behulp van tijdreeksgegevens

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Lurking variabele

A

Een derde variabele die niet wordt gemeten in een onderzoek, maar die wel de associatie tussen responsvariabele en verklarende variabele beïnvloedt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Simpson’s paradox

A

Richting van associatie kan veranderen nadat een derde (lurking/condfounding) variabele is opgenomen en gegevens op afzonderlijke niveaus van die variabele hebben geanalyseerd.
In hele dataset relatie positief, maar door opdelen andere variabele negatief, of andersom.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Verklaarde variantie

A

De mate waarin de regressievergelijking van X en Y de afhankelijke variabele beter voorspelt dan het gemiddelde van Y.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Correlatie- en regressiemethoden verband (3) en verschil (3)

A

Verband
○ Beide geschikt wanneer de relatie tussen twee kwantitatieve variabelen kan worden benaderd door een rechte lijn
○ De correlatie en de helling van de regressielijn hebben hetzelfde teken. (+/-/0)
○ Beiden nonresistant (vatbaar voor vervorming door uitschieters)

Verschil
○ Bij correlatie altijd dezelfde uitkomstwaarde, bij regressie andere y waarden
○ Correlatie zit tussen -1 en +1, regressie elk reëel getal
○ Bij regressie is het y-snijpunt van belang, bij correlatie niet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Regressielijn-/vergelijking (prediction equation)

A
  • Enkelvoudige lineaire regressie: 1x- waarde
  • Gaat altijd door gemiddelde van x en gemiddelde van y
  • (y_i ) ̂=a+bx_i
  • Voorspelt waarde y (responsvariabele) als je x (verklarende variabele) weet
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Risico’s Regressielijn-/vergelijking (prediction equation) (3)

A

○ Je kan niet voorspellen wat ver buiten je onderzochte data ligt
§ Extrapolatie: Voorspellen regressielijn (ver) buiten waargenomen gegevens
§ Vaak toegepast op waarnemingen van een kwantitatieve responsvariabele in de tijd

○ Uitschieters invloed op regressielijn of proportie verklaarde variantie

○ Simpson’s paradox

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Residuals= residu (predictionerror= voorspellingsfout)

A
  • (y−y ̂)
  • Verschil tussen werkelijke y-waarde en daadwerkelijke lijn
  • Verticale afstand tussen het punt en de regressielijn
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Influential (invloedrijke uitschieter)

A

Wanneer een waarneming een groot effect heeft op de resultaten van een regressieanalyse

x-waarde is relatief laag/hoog in vergelijking met de rest van de gegevens

De waarneming is een regression outlier, die ver afwijkt van de trend

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Least squares method (kleinste kwadraten methode)

A

∑〖(y−y ̂)〗^2
Lijn gekozen waardoor afstand tot alle punten zo klein mogelijk

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Proportie verklaarde variantie (proportionele reductie) (R2)

A
  • Hoeveel beter is de regressielijn (voorspelling) beter dan het gemiddelde van y is
  • Hoeveel van de totale variabiliteit in scores kan verklaard worden door de regressielijn
  • Verhouding kwadratensom regressie formule t.o.v. kwadratensom van totale variabiliteit
  • Hoeveel van totale spreiding scores kan verklaard worden door regressievergelijking
  • Je kan r kwadrateren bij enkelvoudige lineaire regressies
  • Percentage van de variabiliteit in de responsvariabele
  • Hoe groter, hoe nauwkeuriger voorspelling van regressievergelijking
  • Tussen 0 (geen verband) en 1 (100%) (perfecte voorspelling)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Common cause

A

1 variabele beïnvloedt zowel verklarende- als responsvariabele

Niet vaak het geval

Temperatuur beïnvloedt aantal verkochte ijsjes en verdrinkingsdoden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Multiple cause

A

Meerdere oorzaken die associatie beïnvloedt

Moeilijk effect bestuderen

Opgroeien in armoede veroorzaak grotere kans misdaad. Dit wordt alleen door veel andere oorzaken beïnvloed

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Confounding

A

Wanneer twee verklarende variabelen geassocieerd zijn met responsvariabele, maar ook met elkaar

Deze wordt wel meegenomen in je onderzoek (een lurking variabele niet)

Aantal doden en rokers. Rokers leek eerste instantie kans op dood gaan te verkleinen, maar door leeftijd mee te nemen, bleek de kans juist vergroot te worden (confounder: leeftijd)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly