5. predavanje: Uvod u regresijsku analizu Flashcards

1
Q

Navesti razliku između reziduala ei

i pogreške εi.

A

Rezidual je razlika između opažene vrijednosti yi i predviđene vrijednosti ŷi. Pogreška je razlika između opažene vrijednosti yi i stvarne (očekivane) vrijednosti µy|x.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Za što je moguće koristiti regresiju?

A
  • Predviđanje: procjena izlaza y za novi X
  • Deskriptivna analiza podataka: usporedba
    srednjih vrijednosti kroz grupe podataka
  • Modeliranje uzročnosti: razumijevanje kako
    se izlaz y mijenja, ako manipuliramo
    prediktorima X
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Interpretirati procijenjene parametre β za slučaj jednog binarnog prediktora Xi.

A
  • β1: očekivana vrijednost za točke s Xi = 0
  • β2: razlika u očekivanim vrijednostima
    između točaka s Xi = 1 i Xi = 0
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Interpretirati procijenjene parametre β za slučaj jednog kontinuiranog prediktora Xi.

A
  • β1: očekivana vrijednost za točke s Xi = 0
  • β2: razlika u očekivanim vrijednostima
    između točaka čija se vrijednost Xi razlikuje za 1
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Interpretirati procijenjene parametre β za slučaj jednog kontinuiranog i jednog binarnog prediktora Xi.

A

Subpopulacije imaju isti nagib (vrijednost parametra β uz kontinuirani prediktor), međutim razlikuju se u pomaku (ovisno o tome je li binarni prediktor uključen ili ne).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Interpretirati procijenjene parametre β za slučaj interakcije jednog kontinuiranog i jednog binarnog prediktora Xi.

A
  • β1: očekivana vrijednost za točke s Xi = 0, Xj =
    0
  • β2 (binarni): razlika u očekivanim
    vrijednostima između točaka s Xi=0 i Xi=1,
    za Xj = 0
  • β3 (kontinuirani): razlika u očekivanim
    vrijednostima između točaka čija se vrijednost
    Xi razlikuje za 1, za Xi = 0
  • β4 (interakcija): razlika u nagibima
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Definirati p-vrijednost u kontekstu procjene parametara β.

A

Vjerojatnost procjene takvog koeficijenta ili ekstremnijeg ako je stvarni koeficijent nula (=H0 hipoteza).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Definirati udio varijance objašnjene modelom, R^2.

A

R^2 = 1 - varijanca(rezidual)/varijanca(pogreška)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Definirati SST, SSR i SSE i povezati ih jednakošću.

A
  • SST = sum_i (yi - ȳ)^2
  • SSE = sum_i (yi - ŷ)^2
  • SSR = sum_i (ŷ - ȳ)^2
  • SST = SSE + SSR
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Iskazati koeficijent determinacije, R^2 korištenjem SSR, SST i SSE.

A
  • R^2 = SSR/SST

- R^2 = 1 - SSE/SST

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Navesti pretpostavke u regresijskom modelu.

A
  1. valjanost
  2. aditivnost i linearnost
  3. nezavisnost pogrešaka: nema interakcije
    između ulaza
  4. konstanta varijanca reziduala
  5. normalnost reziduala
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Opisati pretpostavku valjanosti u regresijskom modelu.

A

a. izlazne vrijednosti trebaju točno odražavati
fenomen od interesa
b. model treba uključivati sve relevantne
prediktore
c. model treba generalizirti na slučajeve na
koje će se primjenjivati

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Opisati pretpostavku aditivnosti i lineranosti u regresijskom modelu.

A

Model je linearan u koefijentima (ne nužno u čistim varijablama); prediktori mogu biti arbitrarne funkcije čistih ulaznih vrijednosti.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Navesti transformacije prediktora i izlaza.

A

a) prediktori centrirani oko srednjih vrijednosti:
Xik ← Xik − mean(X1k, …, Xnk), 𝛽k = srednja
vrijednost porasta izlaza y za svaku jedinicu
porasta Xik
b) standardizacija via z-scores:
Xik ← [Xik − mean(X1k, …, Xnk)] / sd(X1k, …,
Xnk), omogućava nam usporedbu
koeficijenata za prediktore sa prethodno
neusporedivim jedinicama mjere
c) logaritmi izlaznih vrijednosti: aditivni model
postaje multiplikativni

How well did you know this?
1
Not at all
2
3
4
5
Perfectly