Vecka 1 del 5 Flashcards

1
Q

Vilken modell ska vi välja?

A

Den med högst justerade R2 .

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
1
Q

När kan det justerade R2 till och med bli negativt?

A

Om SSE är avsevärt större än noll och k är stort i förhållande till n samtidigt som korrelationen mellan responsvariabeln och de förklarande variablerna är tillräckligt låg.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vad används det justerade R2 för?

A

Att jämföra konkurrerande linjära regressionsmodeller med olika antal förklarande variabler.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Vilka sätt kan användas för att jämföra linjära regressionsmodeller med olika antal förklarande variabler?

A

Både standard felet för uppskattningen och det justerade R2 kan användas men justerade R2 är det som föredras.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vad menas med överanpassning?

A

När en uppskattad modell börjar beskriva detaljer istället för de verkliga relationerna mellan variablerna

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Vad kan man göra för att testa så modellen inte överanpassar?

A

För att testa modellens prediktiva förmåga kan man testa den på en datauppsättning som inte användes i skattningen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Varför används dummyvariabler?

A

För Kategoriska variabler kan också ha en betydande på verkan på en variabel och bör då beaktas i regressionsmodellen. För att använda en kategorisk variabel i en regressionsmodell omvandlar vi den till en dummyvariabel, även känd som indikatorvariabel.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Vilka värden antar en dummyvariabel d?

A

Värdet 1 för en av kategorierna och 0 för den andra.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Varför används T-testet?

A

För att testa om varje koefficient är signifikant annorlunda från noll. Om t-värdet är stort nog tyder det på att dummy variabeln har en signifikant inverkan på den beroende variabeln y. Om det är lågt kan vi inte med säkerhet säga att variabeln har någon inverkan.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hur gör vi för att undvika dummyvariabel fällan?

A

undviker att inkludera en dummy variabel för varje kategori eftersom det skulle leda till en perfekt multikollinearitet. Istället omvandlar du varje kategori utom en till en dummvariabel.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly