Lecture 5 (Boken) Flashcards

1
Q

När man har en funktion som inte är linjär, vad beror då lutningen i denna funktion på?

Vad beror den på vid en dummy?

A

Värdet på X variabeln!

Vid en dummy kommer man helt skifta slope.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vilka estimat använder man för att estimera linjen för icke-linjära förhållanden?

A

OLS

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Om man funderar över huruvida man ska använda kvadratisk form eller inte, hur ska man gå tillväga för att veta om det är den bästa formen?

A

För att testa om en icke-linjär modell passar bättre testar man om den icke-linjära variabelns beta = 0 eller ej.
Alltså Y = α + β1(utbildning) + β2(utbildning)^2 så testar vi om β2 = 0. Är den det så är inte den kvadratiska formen en bättre fitt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vad är den generella formen för en kvadratisk funktion?

A

Generell form för en kvadratisk funktion är

Yi = f(X1,X2…..X1i) + Ui

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hur räknar vi effekten vid ett speciellt ställe vid funktionell form?

Alltså vad effekten av t.ex ett trä’ningsprogram är om X = ….

Hur tolkar man β?

A

Effekten är ju olika beroende på vilket värde av X vi har.
f(X1 + ΔX1, X2……..) - f(X1, X2……)

Så ΔY = (β0+β1X’1 + β2X’1^2) - (β0+β1Χ1-β2X1^2)

Borde också gå att derivera?

När man har en kvadratisk form kan man alltså inte tänka på β1 som effekten. utan man måste räkna effekten beroende på vilket värde på X man har.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Ju kan man mäta fitten på en icke linjär modeller där vi använder logaritmer?

A

För att se vilken modell som passar bäst kan vi använda R^2 vid Log-Log och Log-linjär. Men inte för att jämföra linjär-log och log-linjär eller Log-log och linjär-Log då vi byter enhet på Y.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Om vi har två dummys, D1 och D2. Hur skriver vi då en funktion där vi tar med interaktionen av D1 och D2?

Alltså om vi t.ex mäter effekter av utbildning på lönen, kontrollerat för kön, men vi tror också att det kan vara en interaktion så att tjejers lön påverkas mer av en högre utbildning än killars. Tjejer får mer ut av sin utbildning.

Hur ställs detta upp i en regression?

A

Yi = β0 + β1D1 + β2D2 + β3(D1*D2) + u

Då D1*D2 är interaktionstermen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Vad är interaktionstermen i

Yi = β0 + β1D1 + β2D2 + β3(D1*D2) + u

I termer av E(Y|………

A

E(Yi| D1i = 1, D2i = d2) - E(Yi|D1i = 0, D2i = d2) = β1 + β3d2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Givet

Yi = β0 + β1D1 + β2D2 + β3(D1*D2) + u

Om D2 = 0 -> Man
Om D2 = 1 -> Kvinna

D1 = 1 -> utbildning

Var är då effekten av utbildningen för män och vad är utbildningen för kvinnor?

Vad är skillnaden dem emellan?

A

β1 effekten av utbildningen för män

β1 + β3 är effekten av utbildningen för kvinnor

β3 är skillnaden i effekt mellan män och kvinnor

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Det går självklart bra att ha interaktioner för en kontinuerlig och en diskret eller två kontinuerliga variabler. Exempel vis effekten på lönen av ett extra år av arbetslivserfarenhet givet att man har en masterutbildning eller inte.

Givet ekvationen

Yi = β0 + β1X1 + β2D2 + β3(D1*X1) + u

Där D1 är dummy där 1 = masterutbildning och 0 = inte masterutbildning.
X1 kontinuerlig variabel i termer av år av utbildning.

Vad betyder då de olika koefficienterna?

A

Skillnaden mellan intercepten (ingångslönen med eller utan utbildning) är β2.

Skillnaden mellan slopsen (effekten av arbetslivserfarenheten beroende på om man har utbildning eller inte) är då β3.

β1 är då effekten av ytterligare ett års arbetslivserfarenhet för de utan masterutbildning.

β1 + β3 är effekten av ytterligare ett års arbetslivserfarenhet givet en +masterutbildning.
β3 är då skillnaden i effekten mellan ytterligare ett år med eller utan utbildning.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Vilket test är lämpligt att använda för att testa koeffesienterna vid interaktioner?

A

F-Test

Man kan använda F-test för att testa interaktionerna, om β3 = β2 = 0 osv.
Likadant t-test om interaktionerna är signifikanta osv.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Givet Y = β0 + β1X+ u

Vad är elasticiteten av E(Y|X) med hänseende på X?

A

β1X/(β0+β1X)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Givet Y = β0 + β1 ln(X)+ u

Vad är elasticiteten av E(Y|X) med hänseende på X?

A

β1X/(β0+β1 ln(X))

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Givet ln(Y) = β0 + β1X+ u

Vad är elasticiteten av E(Y|X) med hänseende på X?

A

β1X

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Givet ln(Y) = β0 + β1ln(X)+ u

Vad är elasticiteten av E(Y|X) med hänseende på X?

A

β1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Vilken typ av elasticitet har log log elasticitet?

A

Log log har konstant elasticitet.

Vid de andra beror elasticiteten på X.

17
Q

För att studera binära utfallvariabler kan man använda sannolikhetsmodeller. Vad säger då utfallen?

Hur fungerar X och Y värdet?

A

Där säger utfallet hur hög sannolikheten är givet X att utfallet är det ena eller andra.
Den binära utfall variablen är ett eller noll, effekten man får säger vad sannolikheten är att utfallet är 1.
T.ex, om X = 0.3 så är sannolikheten att Y = 0.2…. (se figur).

Alltså ett x-värde stiftar till en korisponderande sannolikhet på Y axeln i ett diagram.

Det säger då hur hög sannolikheten är att Y = 1.

Så, värdet på X gånger slopen (β1) plus interceptet (β0) kommer ge en sannolikhet för hur troligt det är att Y = 1.

18
Q

Hur skriver man formellt ”sannolikheten att Y = 1 givet X?

A

Pr(Y = 1| X1……Xk)

19
Q

Vilka test använder man vid linjära sannolikhetsmodeller?

A

Vid dessa kan man använda alla vanliga OLS test. CI, T- och F-test och SE. Dock fungerar inte R^2. Man använder istället ”fraktion correctly predicted” eller ”pseudo-R2”

20
Q

Hur ska man tolka β1 vid en linjär sannolikhetsmodell?

A

β1 i en linjär sannolikhetsmodell ska tolkas som förändringen i sannolikhet att Y = 1 givet förändring i en enhet av X1 när man håller de andra variablerna konstant.

21
Q

Om man har en linjär sannolikhetsmodell med en binär kontrollvariabel, hur ska man då tolka koefficienten för kontrollvariablen?

A

Har man en binär variabel som man kollar mot, t.ex hudfärg, svart D = 1 eller inte svart D = 0. Så betyder β för den variabeln hur mycket mer sannoilikt det är att Y = 1 om D =1.

Om β2(Black) = 0.177X
Så är det alltså 17.7% mer troligt att Y = 1 om man är svart.

22
Q

Vad är huvudproblemet vid linjära sannolikhetsmodeller?

A

Ett problem med linjära sannolikhetsmodeller är att de kan anta värden under 0 och 1 samt att sannolikheterna ökar linjärt. Varför man istället använder icke-linjära modeller som Probit eller Logit.

23
Q

Vad är det som gör probit och logit modeller lämpliga som sannolikhetsmodeller?

A

Probit och Logit regressioner är icke-linjära regressionsmodeller specifikt designade för binära beroendevariabler. Dessa tvingar fram värden mellan 0 och 1 pga att kumulativa sannolikhetsdistributioiner används.

24
Q

Vad är formeln för Probit modellen och vad gör denna?

A

Pr(Y = 1|X) = φ(β0 + β1X)
Där φ är den kumulativa standard normalfunktionen.

I en sådan model spelar betorna rollen som Z i den kumulativa standarddistributionen. Sammanräkningen av betorna ger alltså ett Z värde som man sedan svårt upp i normalfördelningstabellen.

25
Q

Vad betyder ett positivt respektive negativt β1 värde vid sannolikhetsmodeller?

A

Ett positivt värde på β1 säger att en ökning i X kommer öka sannolikheten att Y = 1 och tvärt om i fall β1 är negativ.

26
Q

Probit och logit är icke linjära. Hur ska man då veta effekten?

A

Effekten på den predicerade sannolikheten av en förändring i regressionen räknas genom att

(1) räkna den predicerade sannolikheten för det initiala värdet vid regressionen,
(2) räkna den predicerade sannolikheten för det nya värdet av regressionen och
(3) ta skillnaden där emellan. Alltså precis som då man kollar effekten vid en icke-linjär regressionsmodell.

27
Q

Vilka tester använder man för att värdera resultaten i probit och logit modeller?

A

Man estimerar både probit och logit med maximum likelyhood.

28
Q

Hur fungerar logit modeller?

A

Logit modellen är precis som probit modellen, men här har den kulmulativa standard normaldistributionen bytts ut mor den kulmulativa standard logistiska distributionen.

29
Q

När och varför ska man välja logit/probit eller linjära modeller?

A

När man väljer mellan probit eller logit så producerar de typ exakt samma resultat, man väljer den som är enklast att använda givet det statistikprogramet man har.

Den vanliga linjära modellen är enklare att använda och tolka än både probit och logit, men den fångar inte den icke-linjära naturen av den sanna populations regressions funktionen. Alltså mindre trovärdig, och man kan få konstiga sannolikheter om man har extremvädren.

Men givet att man har data utan allt för extrema värden så går den linjära modellen också bra att använda.