Prehľad typov štatistických údajov a premenných Flashcards
druhá prednáška
Štatistické údaje
faktické informácie používané ako základ na zdôvodnenie, diskusiu alebo výpočet
Tabuľka údajov
pozorovania (riadky)
premenné (stĺpce)
Dataset
súbor údajov, ktorý zahŕňa viacero dátových tabuliek, s rôznymi druhmi informáciami, ktoré sa majú použiť v tej istej analýze
Pracovanie s údajmi
štrúktúrovanie, čistenie a analyzovanie údajov
Základné aspekty dát:
obsah
validita
spoľahlivosť
porovnateľnosť
pokrytie
Zdroje dát
administratívne dáta
prieskumy
experimenty
web scraping
sekundárne zozbierané dáta
Druhy štatistických údajov
prierezové
panelové (longtudinálne)
údaje časových radov
neštruktúrované
vizuálne
kombinácie
Prierezové údaje
súbor údajov o jednotlivcoch, domácnostiach, firmách, mestách…, zozbieraných v danom časovom okamihu, na poradí údajov nezáleží, častý problém napr. s neochotou odpovedať na citlivé otázky alebo porušenie náhodného výberu
Panelové (longtiduálne) údaje
sledovanie rovnakých prierezových subjektov v čase, údaje majú rozmer prierezu (N) a časového radu (T), vyvážený/nevyvážený panel
Panelové údaje formy
Veľké N a malé T - veľký počet prierezových pozorovaní a krátky časový rad
Malé N a veľké T - malý počet prierezových pozorovaní a dlhý časový rad
Údaje časových radov
Pozorovania premennej alebo niekoľkých premenných v priebehu času, frekvencia údajov denne, týždenne, mesačne, ročne, dôležitosť na usporiadanie údajov, najmä v chronologickom poradí
Údaje časových radov - charakteristiky
sú typicky sériovo korelované, majú trend, sezónnosť, cyklickosť, biely šum, využitie v makroekonómii, v financiách, napr. ceny akcií, vedia predikovať
Základné pojmy štatistiky
štatistická jednotka
štatistický súbor
štatistický rozsah súboru
štatistický znak
Štatistická jednotka
základný prvok, na ktorom pozorujeme konkrétny prejav určitého hromadného javu napr. osoba, domácnosť, výrobok
Štatistický súbor
Množina všetkých štatistických jednotiek, ktoré majú požadované spoločné vlastnosti