PAS Flashcards
Význam slova statistika
Statistika je vědní obor, zabývající se metodami kvantitativního hodnocení vlastností hromadných jevů a procesů.
Umožňuje nám pochopit, interpretovat a předvídat jevy ve světě pomocí datových analýz.
Využívá se zde hypotéza, což je výpověď, jejíž platnost se pouze předpokládá a je formulovaná tak, aby jí bylo možno potvrdit nebo vyvrátit.
Dělí se na dvě statistiky, a to Aplikovanou a Matematickou statistiku.
Statistika se dělí na
Dělí se na dvě statistiky, a to Aplikovanou a Matematickou statistiku.
Aplikovaná statistika
Zaměřuje se na praktické využití statistických metod v různých oblastech, jako jsou biologie, ekonomie, inženýrství, medicína, veřejná politika, psychologie a další.
Cílem je nalézt specifické odpovědi na otázky týkající se konkrétních datových souborů.
Aplikovaná statistika se dělí na
Získávání dat, Analýza dat, Statistické usuzování
Získávání dat
Několik metod: průzkumy, experimenty, pozorování nebo využití existujících databází; Klade se důraz na výběr reprezentativních vzorků, zajištění spolehlivosti a validnost dat
Analýza dat
Používají se nástroje pro organizaci, shrnutí a vizualizaci dat; Metody: frekvenční tabulky, grafy, míry střední hodnoty (aritmetický průměr, medián, modus)
Statistické usuzování (inference, indukce)
Zabývá se vyvozováním závěru, testování hypotéz nebo predikci budoucích trendů; Zahrnuje metody jako jsou intervaly spolehlivosti, hypotézové testování, regresní analýza a analýza rozptylu
Matematická statistika
Je založena na teorii pravděpodobnosti. (Střední hodnota, rozptyl, kovariance)
Hledá vlastnosti náhodné veličiny (veličina, kterou je možná opakovaně měřit: teplota na určitém místě, ve stejný čas, různé dny)
Klade důraz na matematické dokazování a teoretické základy statistických metod.
Cílem je rozvoj a studium statistických metod z matematického hlediska.
Zahrnuje pravděpodobnost, teorii odhadu, teorii testování hypotéz, regresní analýzu, časové řady, statistická simulace
Předmět zájmu statistiky:
Sběr, organizace a prezentace dat.
Vývoj a použití metod pro analýzu dat.
Vytváření matematických modelů pro interpretaci a předpovědi na základě dat.
Poskytnutí nástrojů a metod pro správné rozhodování na základě dat.
Pojmy (Populace, vzorek…)
Populace – Celkový soubor všech jednotek – lidi, objekty, události
Vzorek – Podmnožina populace, která je vybraná pro skutečnou analýzu
Statický soubor – Skupina dat, který je vybraná pro analýzu (celá populace nebo vzorek populace)
Statistický jednotka – Jednotlivý prvek nebo entita ve statistickém souboru
Proměnná (Statistický znak) – Charakteristika nebo vlastnost statistické jednotky
Náhodná proměnná – Proměnná, jejíž hodnoty jsou výsledkem náhodného jevu
Hypotéza – Předpoklad nebo tvrzení o parametru/distribuci populace
Nulová hypotéza (H0) – žádný rozdíl/efekt
Alternativní hypotéza (H1) – rozdíl/efekt
P-hodnota – Hodnota, která pomáhá krozhodnutí správnosti hypotézy
Popisná Statistika (Deskriptivní Statistika):
Popisná statistika se zabývá sumarizací a organizací dat pomocí různých statistických nástrojů.
Hlavním cílem je zjednodušit, shrnout a uspořádat velké množství dat tak, aby byla snadno pochopitelná.
Pomáhá identifikovat vzory, trendy nebo odchylky v datech.
Poskytuje základní přehled charakteristik dat bez pokusu o vyvozování závěrů.
Podklady a vstupní údaje Popisné statistiky
Kvalitativní (kategorická):
Nominální – Kategorická: černá, bílá, žlutá
Neuspořádaná (nemají logické pořadí – malý, střední, velký)
Ordinální – Uspořádaná (mají logické pořadí)
Nejednotné rozdíly (i když mají stejné pořadí, neznamená to, že rozdíl mezi základním a středním vz. je stejný jako střední a vysokoškolské vzdělání)
Kvantitativní (číselná, kardinální):
Obě mohou být diskrétní (specifické, oddělené hodnoty – počet knih v knihovně), spojité (rozsah – hmotnost)
Intervalová – Mají definovaný rozsah mezi hodnotami
nemají absolutní nulu: IQ, Stupně Celsia
Poměrová – Mají definovaný rozsah mezi hodnotami
absolutní nula (nepřítomnost daného jevu): věk, výška, hmotnost, příjmy
Metody zahrnují například výpočet průměru, mediánu, módu, rozptylu, směrodatné odchylky, kvartilů.
Využívá grafické reprezentace jako jsou histogramy, sloupcové, koláčové a krabicové grafy.
Inferenční Statistika (Induktivní Statistika)
Zabývá se analyzováním a interpretací vzorků dat s cílem vyvozování závěrů o celém souboru entit.
Používá teorii pravděpodobnosti – kombinatorická (klasická) pravděpodobnost nebo modely různých rozdělení pravděpodobnosti – binomické, geometrické, hypergeometrické, poasonovo, normální, lognormální, exponenciální nebo rovnoměrné
Cílem je udělat zobecnění o souboru entit na základě vzorků, s určitým stupněm spolehlivosti.
Pomáhá formulovat hypotézy a rozhodnutí založené na statistických testech.
Zaměřuje se na odhad neznámých parametrů a testování statistických hypotéz.
Podklady a vstupní údaje Inferenční statistiky
Vyžaduje náhodný výběr dat nebo reprezentativní vzorky pro validní závěry.
Využívá koncepty a metody jako jsou intervaly spolehlivosti, p-hodnoty, regresní analýza nebo analýza rozptylu.
Možnost Transformace Mezi
Kvalitativní na Kvantitativní:
Převod ordinálních proměnných na číselné hodnoty (hodnocení výrobku od 1 do 5).
Přiřazení číselných hodnot nominálním kategoriím pro účely statistické analýzy (0 muži, 1 ženy).