Kowariancja Flashcards
W układzie współrzędnych zaznaczamy punkty o współrzędnych (x, y) odpowiadające poszczególnym obserwacjom.
wykres korelacyjny
Zmienna która wywołuje zmiany, stanowi ich przyczynę.
Zmienna niezależna
Zmienna, której wartości są kształtowane przez zmienną niezależną (zmienne niezależne). Zwykle stosujemy oznaczenia:
Y - zmienna zależna (objaśniana)
X - zmienna niezależna (objaśniająca)
Zmienna zależna
np. pole kwadratu jest funkcją jego boku
Zależność funkcyjna
zależność funkcyjna jest zakłócona występowaniem czynnika losowego; na zmienną objaśnianą Y oprócz zmiennej X oddziałuje wiele innych zmiennych, często niezidentyfikowanych, nieobserwowanych i mających różnokierunkowe wpływy; tej samej wartości zmiennej X, mogą zatem odpowiadać różne wartości zmiennej Y; Np. gdy rozpatrujemy cenę mieszkania i jego powierzchnię
Zależność stochastyczna/statystyczna
charakteryzuje się tym, że określonym wartościom jednej zmiennej przyporządkowane są ściśle określone średnie wartości drugiej zmiennej
Zależność korelacyjna
gdy jednostkowemu przyrostowi jednej zmiennej (przyczyna) towarzyszy, przeciętnie rzecz biorąc jednakowy przyrost drugiej zmiennej (skutek)
zależność liniowa
wskazuje kierunek (ale nie siłę) zależności między zmiennymi X i Y
Kowariancja
oznacza, że wraz ze wzrostem wartości jednej zmiennej wartości drugiej zmiennej także przeciętnie rzecz biorąc rosną (i odwrotnie: wraz ze spadkiem… spadają)
Kowariancja znak dodatni
oznacza, że wraz ze wzrostem wartości jednej zmiennej wartości drugiej zmiennej przeciętnie rzecz biorąc maleją
Kowariancja znak ujemny
oznacza brak zależności między badanymi zmiennymi
Kowariancja zero
Przyjmuje wartości od -1 do +1.
Im większa jego wartość bezwzględna tym większa siła korelacji (związku) między zmiennymi.
Wartość równa 0, nie zawsze oznacza brak zależności, a jedynie brak zależności liniowej.
Wartość 1 oznacza doskonałą zależność dodatnią, wartość -1 doskonałą zależność ujemną.
Współczynnik korelacji liniowej jest pewnym wskaźnikiem, a nie pomiarem.
Współczynnik korelacji liniowej
+ wzrostowi wartości jednej zmiennej towarzyszy wzrost przeciętnych wartości drugiej
- wzrostowi wartości jednej zmiennej odpowiada spadek przeciętnych wartości drugiej
Znak współczynnika korelacji liniowej
r_xy = 0 - brak korelacji liniowej między zmiennymi (zmienne nieskorelowane liniowo)
r_xy<0,2 - bardzo słaba zależność liniowa, zwykle jej brak
0,2<r_xy<0,4 - słaba zależność liniowa
0,4<r_xy<0,7 - umiarkowana korelacja liniowa
0,7<r_xy<0,9 - silna korelacja liniowa
r_xy> 0,9 - bardzo silna korelacja liniowa
r_xy=1 doskonała zależność liniowa (związek funkcyjny)
Interpretacja współczynnika korelacji liniowej
jest miarą zależności cech mierzonych w skali porządkowej.
Współczynnik jest stosowany:
a) gdy cechy są mierzalne, a badana zbiorowość nieliczna
b) gdy cechy mają charakter jakościowy i istnieje możliwość ich uporządkowania
Współczynnik korelacji rang Spearmana (współczynnik korelacji kolejnościowych)
polega na nadaniu jednostkom statystycznym kolejnych liczb naturalnych (rang) od 1 do n (gdzie n oznacza liczbę obserwacji) pod względem uporządkowanych kategorii cechy (np. kolejność biegaczy na mecie - uporządkowanie biegaczy wg czasów przybycia na metę; np. atrakcyjność inwestycyjna obszaru w skali od 1 do 10)
Współczynnik przyjmuje wartości od -1 do +1 (-1 oznacza pełną przeciwstawność uporządkowań, +1 pełną zgodność uporządkowań, 0 - brak zgodność uporządkowań)
Rangowanie
ustalonym wartościom cechy niezależnej przypisuje średnie wartości cechy zależnej, a jej parametry zwykle szacuje się wykorzystując metodę najmniejszych kwadratów.
Liniowa funkcja regresji
b określa o ile jednostek przeciętnie zmieni się (wzrośnie lub zmaleje) wartości cechy Y, gdy wartość cechy X wzrośnie o 1 jednostkę
Współczynnik ma ten sam znak co współczynnik korelacji
Współczynnik kierunkowy regresji -b
tylko niekiedy ma sensowną interpretację ekonomiczną: teoretyczna (przeciętna, w sensie regresji) wartość zmiennej Y gdy zmienna X przyjmuje wartość 0.
Wyraz wolny - a
informuje nas o ile przeciętnie rzecz biorąc różnią się wartości rzeczywiste (zmiennej Y) od wartości teoretycznych obliczonych na podstawie oszacowanego modelu regresji
Odchylenie standardowe składnika resztowego modelu
Współczynnik zmienności resztowej informuje nas jaka część (w %) średniej wartości zmiennej objaśnianej stanowi odchylenie standardowe składnika resztowego modelu.