Statistika,!- Prehl’ad typov statistickych údajov a premmenych Flashcards
Štatistické údaje môžeme definovať ako
fakticke informacie
(ako su merania alebo statistiky) používane ako základ na
zdôvodnenie, diskusiu alebo výpočet
Základné aspekty kvality dát:
▸ Obsah - OVSPPN
▸ Validita
▸ Spolahlivost’
▸ Porovnatel’nost’
▸ Pokrytie
▸ Neskresleny vyber
Kazda ekonometricka / statisticka analyza sa spolieha na statisticke údaje, ktore mozeme charakterizovať’ nasledovne:
- Prierezové údaje
- Panelové (longitudinalne) údaje
- údaje časových radov
- Neštruktúrované údaje
- Vizuálne údaje
Prierezové údaje
Súbor údajov o jednotlivcoch, domácnostiach, firmách,
mestách, štátoch, krajinách alebo iných záujmových jednotkách zozbieraných v danom časovom okamihu / v danom období
▸ Pri prierezových údajoch na poradí údajov nezáleží. Inými slovami, údaje môžeme usporiadať’ vzostupne, zostupne alebo
dokonca náhodne a to neovplyvni výsledky modelovania.
Údaje casovych radov
Pozorovania premennej alebo niekol’kych premenných v priebehu času
▸ Frekvencia ´údajov: denne, týždenne, mesačne, štvrťročne,
ročne, ale frekvencia môže byt’ aj na úrovni min´ut, sek´und
▸ Na rozdiel od prierezov´ych ´udajov je v ´udajoch ˇcasov´ych
radov dˆoleˇzit´e usporiadanie ´udajov. Kaˇzd´y bod predstavuje
hodnoty v konkr´etnych ˇcasov´ych bodoch. Udaje o ˇcasov´ych ´
radoch s´u zvyˇcajne prezentovan´e v chronologickom porad´ı.
Zmena poradia ´udajov ignoruje ˇcasov´dimenziu ´udajov
▸ Pozorovania ˇcasov´ych radov s´u typicky s´eriovo korelovan´e –
pr´ıtomnost’ z´aleˇz´ı na minulosti, atd’
▸ Napr´ıklad ceny akci´ı, ponuka peˇnaz´ı, index spotrebitel’sk´ych
cien, hrub´y dom´aci produkt, cena nehnutel’nost´ı …
Typy premennych: ▸ Numericke premenn´e (kvantitat´ıvne):
▸ Spojit´a premenn´a: je ˇc´ıseln´a premenn´a a pozorovania mˆoˇzu
mat’ ak´ukol’vek hodnotu medzi urˇcitou hranicou re´alnych ˇc´ısel
(napr. BMI, teplota vzduchu, hodinov´a mzda, ˇcas, atd’…)
▸ Diskr´etna premenn´a: je ˇc´ıseln´a premenn´a a pozorovania mˆoˇzu
mat’ hodnotu na z´aklade poˇctu zo sady odliˇsn´ych cel´ych
hodnˆot (napr. poˇcet ´aut, poˇcet ˇclenov dom´acnosti)
Kategoricke premenne (kvalitatıvne)
▸ Ordin´alna premenn´a: je kategorick´a premenn´a a pozorovania
mˆoˇzu mat’ hodnotu, ktor´u je moˇzn´e logicky usporiadat’ alebo
zoradit’ (napr. ´uroveˇn vzdelania: z´akladn´e, stredn´e, vysok´e,
atd’.)
▸ Nomin´alna premenn´a: je kategorick´a premenn´a a pozorovania
mˆoˇzu mat’ hodnotu, ktor´u nie je moˇzn´e usporiadat’ do logickej
postupnosti (napr. pohlavie, n´aboˇzenstvo, farba oˇc´ı, atd’.)
Zakladne nastroje na popis udajov / premennych
▸ Frekvenˇcn´e tabul’ky
▸ Stlpcov´y graf
▸ Histogram
▸ Kol´aˇcov´y graf
▸ Box plot
▸ Y-X graf
Miery polohy: Aritmetick´y priemer, V´aˇzen´y priemer,Geometrick´y priemer, chornologicky priemer, Median, Modus, Kvantily
-.-
Miery variability: Variacne rozpatie, Medzikvartilove rozpatie, Priemerna absolutna odchylka, Rozptyl a smerodajna (standardna) odchylka, Variacny koeficient
–.
Miery tvaru: šikomsť, špicatosť
-
Meranie závislosti- koeficient
Koeficienty z´avislosti s´u spravidla konˇstruovan´e tak, aby ich
hodnoty patrili do intervalu od –1 do 1, kde 0 znamen´a ˇziadnu
z´avislost’ medzi premenn´ymi, 1 dokonal´u (deterministick´u)
priamu z´avislost’ a –1 dokonal´u nepriamu z´avislost
Meranie závislosti: Pearsonov korelaˇcn´y koeficient, Kendallov τ koeficient
Pearsonov korelaˇcn´y koeficient (ρ): znazornuje tesnost’
zavislosti medzi dvomi (spojit´ymi) premenn´ymi
Kendall τ koeficient vyuzıva prave princıp tychto zhod, resp.
nezhˆod. V pr´ıpade, ak s´u zhodn´e poradia, tak nedoch´adza ani
k zhode ani k nezhode—- Nh = ((xi < xj) ∧ (yi > yj)) ∨ ((xi > xj) ∧ (yi < yj))
Korelácia ≠ kauzalita a čo je kauzalita
Kauzalita (pr´ıˇcinnost’) znamen´a, ˇze jedna vec spˆosobuje druh´u– in´ymi slovami, jav A spˆosobuje v´ysledok B. Na druhej strane
korel´acia je jednoducho vzt’ah, kde jav A s´uvis´ı s v´ysledkom B
– ale jedna udalost’ nemus´ı nevyhnutne spˆosobit’, ˇze nastane
druh´a udalost’
–Spravidla je v´yskyt z´avislosti nutn´ym predpokladom ku
kauzalite, nie vˇsak postaˇcuj´ucim
Falošná korelácia
V ˇstatistike je faloˇsn´y vzt’ah alebo faloˇsn´a korel´acia
matematick´y vzt’ah, v ktorom s´u dve alebo viac udalost´ı alebo
premenn´ych spojen´e, ale nie s´u v kauz´alnom vzt’ahu, a to bud’
v dˆosledku zhody okolnost´ı, alebo pr´ıtomnosti urˇcit´eho
tretieho, neviditel’n´eho faktora (spoloˇcn´a premenn´a odozvy,
“confounding factor”)
Formulovanie ekonometrick´eho modelu čo to je
▸ Ekonometria je ˇcast’ou ekon´omie, ktor´a sa zaober´a meran´ım a
modelovan´ım ekonomick´ych / finanˇcn´ych veliˇc´ın
▸ Prienik matematiky, ˇstatistiky a ekon´omie
▸ Modely, ktor´e s´u v ekonometrii hlavn´ym objektom z´aujmu, s´u
spravidla formulovan´e pomocou matematick´ych z´apisov ako
rovnice, resp. s´ustavy rovn´ıc
V rámci ekonometrického modelu rozlišujeme medzi dvoma
základnými skupinami premenných
▸ Modelovan´u veliˇcinu, ktorej hodnoty sa snaˇz´ıme pop´ısat’
oznaˇcujeme ako z´avisl´u (vysvetl’ovan´u) premenn´u (Y )
▸ Veliˇciny, ktor´e by mali s´uvisiet’ so z´avislou premennou a
pomocou ktor´ych sa snaˇz´ıme z´avisl´u premenn´u modelovat’
naz´yvame nez´avisl´e (vysvetl’uj´uce) premenn´e
(X ∶ X1,X2, …,Xk )
▸ V ekonometrickom modeli teda m´ame jednu z´avisl´u premenn´u
a jednu alebo viac nez´avisl´ych
▸ Modelovanie ekonomickych veliˇc´ın sa moze zdat’ byt’ narocnou
ulohou, ked’ ze v skutocnosti s akoukol’vek veliˇcinou, napr.
inflaciu, potencialne suvisı vel’mi vel’ka mnozina inych faktorov. Existuju dva problemy:
▸ Uloha identifikovat ´ ’ vˇsetky relevantn´e premenn´e, ktor´e by mali
byt’ v modeli vyuˇzit´e, aby nedoˇslo k vynechaniu nejakej
relevantnej veliˇciny
▸ Kvantifikovanie modelu
Mincerova rovnica je model
ktor´y vysvetl’uje mzdu (pr´ıjem)
ako funkciu vzdelania a skusenost´ı (praxe). Obvykle je
logaritmus mzdy modelovan´y ako s´uˇcet rokov vzdel´avania a
kvadratickej funkcie ”
rokov potenci´alnej praxe“
Engelov zákon je ekonomická teória
ktor´a popisuje vzt’ah
medzi pr´ıjmom dom´acnosti a konkr´etnym v´ydavkom na tovar
alebo sluˇzbu.
Lineárna regresia je:
▸ Line´arna regresia je z´akladn´y modelovac´ı apar´at v ekonometrii!
▸ Pri korel´acii s´u dve premenn´e povaˇzovan´e za rovnocenn´e. Pri
regresii je jedna premenn´a povaˇzovan´a za nez´avisl´u
(predikuj´ucu) premenn´u (X) a druh´a za z´avisl´u (v´ysledn´u)
premenn´u Y
▸ Odhad z´avislost´ı medzi Y a X (alebo viacer´ymi X premenn´ymi)
▸ Odhadnut´y koeficient (sklon regresnej priamky) mˆoˇze
nadob´udat’ l’ubovol’n´e hodnoty (aj mimo intervalu -1 aˇz 1)
Linearna regresia ma mnoho praktických použití. Väčšina aplikácii
spadá do jednej z nasledujúcich dvoch ˇširokých kategórii:
▸ Predikcia alebo prognóza
▸ Vysvetlenie variability v závislej premennej pomocou variability
v nezávislých premenných
lINEARNA regresia vzorec
▸ Ak by sa dala z´avislost’ medzi X a Y vyjadrit’ ako line´arna
funkcia, ktorej grafom je priamka, tak by sme ju mohli zap´ısat’
v tvare:
Y = β0 + β1X + u
význam znakov vo vzorci linearnej funckie
▸ Konˇstanta β0 definuje, kde regresn´a priamka pret´ına os Y .
Plat´ı totiˇz, ˇze pre X = 0 dost´avame:
Y = β0 + β10 = β0
Priamka teda prech´adza bodom [0, β0]
▸ Koeficient β1 predstavuje smernicu, alebo aj tangens uhla,
ktor´y zviera priamka s osou X (sklon priamky). V pr´ıpade, ak
je β1 < 0, priamka je klesaj´uca. Pre β1 > 0 je priamka rast´uca
▸ Posledn´ym pr´ıpadom je β1 = 0 – v takomto pr´ıpade je priamka
rovnobeˇzn´a s osou X a hodnoty Y sa nemenia. V tomto
pr´ıpade mˆoˇzeme aj povedat’, ˇze hodnota y s hodnotou x v
istom zmysle nes´uvis´ı – nech sa x men´ı l’ubovol’ne, t´ato zmena
nie je sprev´adzan´a zmenou premennej y
▸ Ak je koeficient β1 rˆozny od nuly, znamen´a to, ˇze meniace sa
X je sprev´adzan´e zmenou premennej Y
▸ Ak je znamienko koeficientu kladn´e, s rastom X rastie aj Y .
Zauj´ımav´e vˇsak je aj to, o kol’ko vzrastie Y