logistische regressie Flashcards

1
Q

wanneer gebruik je de logistische regressie analyse

A

voorspellen van één kwalitatieve , dichotome afhankelijke variabele door één of meer onafhankelijke variabelen ( kwalitatief of continue)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

waarom werkt een lineaire regressie niet bij één kwalitatieve dichotome afhankelijke variabele?

A

omdat er maar 2 waardes voor kunnen komen ( 0 en 1), zal de regressievergelijking waardes simuleren die niet mogelijk zijn

heteroscedasticiteit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

wat is de intercept E

A

Euter’s constante

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

wat is het voordeel en nadeel van de lineaire functie van ln(odds)

A

voordeel: lineair, dus makkelijker te interpreteren
“een verandering van één eenheid van X leidt tot een verandering van b1 eenheden in Y”

Nadeel: de afhankelijke variabele is lastiger voor te stellen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

interpretatie van termen in LOGITS

A

als predictor met één eenheid stijgt, verandert logit met b eenheden (onder constanthouding overige predictoren)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

interpretatie van termen in ODDS

A

Door toename van één eenheid van predictor wordt odds Exp(B) keer zo groot (onder constanthouding overige predictoren)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

interpretatie van termen in KANSEN

A

Niet rechtstreeks; effect van predictor op kans door invullen van b’s in logistische regressievergelijking

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

wat is de Walds-toets

A

test of B (populatie) afwijkt van 0
–> zelfde functie als t-toets

antwoord vergelijken met X^2 verdeling bij 1 df
–>Als de waldtest in abslute zin grote waardes heeft, dan krijgt die ook grote standaardfouten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

wat is het probleem bij logistische regressie en Chi-square

A

erklaarde variantie R2y.12..m niet zinvol bij dichotome afhankelijke variabele!
→Voor een dummy kun je geen verklaarde variantie berekenen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

wat is de schattingsprocedure van logistische regressie

A

Maximum likelihood schatting

Log lilelihood (LL) = maat voor waarschijnlijkheid dat de geobserveerde data zou zijn verkregen bij de gegeven coëfficiënten uit het (logistische) regressiemodel
–> we gebruiken -2LL omdat deze X^2- verdeeld is

Hoe lager -2LL, hoe beter de parameters de geobserveerde data reproduceren, dus hoe beter het model past!!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

HOE doe je de maximum likelihood schatting

A

Stap 1:
A = -2 log likelihood ‘klein model’ met n regressiecoëfficiënten
B = -2 log likelihood ‘groot model’ met m regressiecoëfficiënten (m>n)

bereken A-B

–> model A is een simplificatie van model B

Stap 2:
A-B is X^2 verdeeld bij m-n df

–> grote model is significant beter als A-B groter is dan de kritieke waarde van X^2 bij m-n df

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

wat is de maximum likelihood schatting nulhypothese

A

“Het kleine model A past even goed als het grote model B”

alternatieve hypothese: “ Het grote model B past beter dan het kleine model A”

toets NIET significant: voorkeur aan model A ( omdat deze eenvoudiger is)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

hoe werkt de model-toets

A

vergelijk model met een aantal (m) predictoren met een ‘leeg’ model, dit is een model met 0 predictoren (logit=a)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly