Prost LRM Flashcards
koeficijent korelacije
mera linearne zavisnosti izmedju dve varijable
ro je na
populaciji
r je na
uzorku
deterministicka veza
jednoj vrednosti x odg samo 1 tacno odredjena y
stohasticka veza
jednoj vrednosti x odg niz mogucih vrednosti sa odg verovatnocama
na cemu se zasniva MNK
na minimiziranju kvadrata odstupanja svih empirijskih tacaka od regresione linije
rezidual e
vertikalno odstupanje izmedju stvarne vrednosti Yi i ocenjene vrednosti, i ocena za epsilon i
pretpostavke MNK
linearnost u parametrima, slucajne greske teze nuli, slucajne greske nisu korelisane sa prediktorima, nema autokorelacije, homoskedastisnost, slucajne greske imaju normalnu raspodelu i x nije slucajna promenljiva (vrednosti su fiksirane)
slucajne greske teze nuli znaci
da je ocekivana vrednost slucajnih gresaka nuka
slucajne greske nisu korelisane sa prediktorima znaci
da je Cov(epsiloni puta Xi)=0
homoskedastisnost je
varijansa slucajnih gresaka - slucajnih odstupanja je konstanta
nema autokorelacije znaci da
da izmedju bilo kojih vrednosti reziduala ne postoji zavisnost, cov(epsiloni puta epsilonj)=0
gauss-markova teorema
Ako linearni regresioni model zadovoljava ovih šest klasičnih pretpostavki, tada MNK daje nepristrasne ocene parametara a i b, koje imaju najmanju varijansu od svih mogućih linearnih ocena regresionih parametara.
najbolja linearna nepristrasna ocena znaci
minimalna varijansa, tj najuza raspodela ocene
osobine ocena MNK
nepristrasnost, efikasnost, konzistentnost (kada N raste b se priblizava beti)
varijansa regresije
srednje kvadratno odstupanje tacaka od prave (vertikalno odstupanje), koliko tacke odstupaju od prave toliko slucajne greske odstupaju od 0
cime merimo kvalitet reprezentativnosti regresione linije
standardnom greskom regresije i koeficijentom determinacije
standardna greska regresije
statisticka mera odstupanja empirijskih tacaka od regresione prave, apsolutna mera odstupanja empirijskih podataka od regresione prave
koeficijent determinacije
relativna mera reprezentativnosti regresione linije, koliko je ucesce objasnjenog varijabiliteta u ukupnom, % varijabiliteta Y koji je objasnjen preko X
beta je
koeficijent nagiba
ako veza nije znacajna (nema povezanosti), beta je
0
t-testom se testira
znacajnost pojedinacnih uticaja
F-testom se testira
znacajnost celokupnog modela (ANOVA)
objasnjeni izvor varijacija potice od
regresionog modela
neobjasnjeni izbor varijacija potice od
reziduala
da bismo korektno koristili LRM za predvidjanje, neophodno je da vazi
dobra reprezentativnost modela (r^2>0.5) i da je model statisticki znacajan (t i F test su se pokazali znacajnim)
zasto je IP za predvidjanje individualnih vrednosti siri?
jer zavisi od slucajne greske
ako je veza direktna, r i ocena b su
veci od nule
ako je veza inverzna, r i ocena b su
manji od nule
na osnovu dijagrama zavisnosti mozemo doneti zakljucak o tome
da li je veza linearna ili krivolinijska, stohasticka ili deterministicka, smer slaganja direktni ili inverzni, jacina veze
slucajno odstupanje epsilon i se javlja zbog
netacnosti u specifikaciji modela, gresaka u merenju observacija promenljivih Y i X i slucajnih elemenata svojstvenih svim pojavama sa prisutnim subjektivnim faktorom
SGR nastaje
zbog varijacija u vrednosti Xi, sto je moguce objasniti modelom i usled delovanja slucajne greske, sto nije
dijagram zavisnosti daje info o
eventualnom postojanju, obliku i jacini veze izmedju posmatranih podataka
kada je sve beta 0
kad je Y const za bilo koje X, kad izmedju posmatranih pojava ne postoji kvantitativna veza ni krivolinsjska funkcionalna veza
ako je beta 0, da li smemo koristiti ocenjenu regresionu liniju za predvidjanje
ne
koju raspodelu imaju slucajna greska i regresioni parametri a i b
normalnu