Statistika Flashcards

1
Q

Typy statistiky (2)

A

1. Popisná statistika zahrnuje metody pro organizaci, zobrazení a popis dat pomocí tabulek, grafů a souhrnných ukazatelů.

2. Induktivní (inferenční) statistika sestává z metod, které využívají výsledky získané na nějakém vzorku k podpoře rozhodování nebo předpovídání faktů o celé populaci.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Kvantitativní x Kvalitativní proměnná

A

Kvantitativní proměnná
- může být vyjádřena numericky
- rozlišujeme diskrétní a spojité proměnné

Kvalitativní proměnná
- nenabývá numerické hodnoty
- často nějaká vlastnost
- př. brava auta, typ zaměstnání

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Diskrétní x Spojité proměnné

A

= kvantitativní proměnné

diskrétní
- celá čísla, často z nějaké množiny
- př. počet dětí v rodině, počet prodejů za měsíc

spojitá
- často z intervalu, může být i desetinné číslo
- př. výška, teplota, délka letu v hodinách

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

typy datových sad:
1. Průřezová data
2. Časové řady
3. Panelová data

A

**1. Průřezová data **
Co to znamená:
Data shromážděná najednou z různých objektů (osob, firem, regionů) ve stejném čase.

Příklad:
Průzkum platů v České republice v roce 2023. (Sbíráš informace o platech od různých lidí ve stejném roce).

2. Časové řady
Co to znamená:
Data, která sledují jednu věc (např. osobu, firmu) v průběhu času.

Příklad:
Počet prodaných aut jedné automobilky každý měsíc od roku 2020 do roku 2023.

3. Panelová data

Co to znamená:
Kombinace průřezových dat a časových řad – sleduješ více objektů (např. lidi, firmy) opakovaně v různých časech.

Příklad:
Sleduješ platy stejných 100 lidí každý rok po dobu 5 let (např. od roku 2018 do roku 2023).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Vysvětli příklady nenáhodného výběru:
1. Judgement sample
2. Convenience sample
3. Pseudo polls
4. Quota sample

A

1. Judgement sample
= závisí na odborném posouzení nebo úsudku jednotlivce provádějícího výzkum

Př. Dopady Covidu - zeptas se reditele nemocnice - ten vi nejvic

2. Convenience sample
= zařazeny na základě jejich snadné dostupnosti nebo
přístupnosti pro výzkumníka

Př. : Výzkumníci chtějí zkoumat nákupní chování, a proto se rozhodnou oslovit lidi v nákupním centru.
Dotazují kolemjdoucí, protože jsou na místě a ochotni odpovědět.

3. Pseudo polls
=Jedná se o situace, kdy jsou prezentovány jako průzkumy veřejného mínění, ale ve skutečnosti nejsou provedeny metodou, která by zaručovala objektivní a reprezentativní vzorek populace.

Př. u „Kdo by měl vyhrát nadcházející volby?“ Vyplní jen návštěvníci webu, kteří mají zájem hlasovat - neni reprezentativni

4. Quota sample
= u účastníci vybíráni na základě určených kvót, aby vzorek odpovídal určitým charakteristikám nebo proporcím ve srovnání s populací.

Př. Úkol: Chcete zjistit názory lidí na nový produkt ve městě, kde je 60 % žen a 40 % mužů. –>
Rozhodnete, že vzorek bude obsahovat 60 % žen a 40 % mužů.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Typy chyb při práci se vzorkem (2)

A
  1. Chyby nezpůsobené výběrem
    = Jedná se o chyby, které vznikají při sběru, záznamu a tabulaci dat a nejsou přímo spojeny s výběrem vzorku.
  2. Výběrová chyba
    = Jedná se o rozdíl mezi výsledkem získaným z výběrového průzkumu a výsledkem, který by byl dosažen, pokud by celá populace byla zahrnuta do průzkumu.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Vysvětli typy chyb nezpůsobené náhodným výběrem:
1. chyba (volby) výběru.
2. chyba nereprezentativní odpovědi.
3. chyba nesprávné odpovědi.
4. chyba dobrovolných odpovědí.

A
  1. kvůli tomu, že výběrový rámec není pro populaci reprezentativní, se nazývá chyba (volby) výběru.
  2. tím, že mnoho lidí zahrnutých do vzorku neodpovídá na průzkum, se nazývá chyba nereprezentativní odpovědi.
  3. když lidé zahrnutí do průzkumu neposkytují správné odpovědi se nazývá chyba nesprávné odpovědi.
  4. když průzkum není proveden na náhodně vybraném vzorku, ale na dotazníku zveřejněném v časopise nebo novinách a lidé jsou pozváni k odpovědi na tento dotazník se nazývá chyba dobrovolných odpovědí.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Techniky náhodného výběru:

  1. Jednoduchý náhodný výběr
  2. Systematický náhodný výběr
  3. Stratifikovaný náhodný výběr
  4. Klastrovaný náhodný výběr
A

1. Jednoduchý náhodný výběr

  • Co to je: Každý člen populace má stejnou šanci být vybrán.
  • Příklad: Losování jmen z klobouku – všechna jména mají stejnou pravděpodobnost, že budou vybrána.

2. Systematický náhodný výběr

  • Co to je: Vyberete každého k-tého člena z uspořádaného seznamu.
  • Příklad: Máte seznam 100 studentů a vyberete každého 5. studenta (5., 10., 15., atd.).

3. Stratifikovaný náhodný výběr

  • Co to je: Populace se rozdělí na skupiny (straty), a z každé skupiny se náhodně vybírá.
  • Příklad: Rozdělíte studenty podle ročníků (1., 2., 3. ročník) a z každého ročníku náhodně vyberete 10 studentů.

4. Klastrovaný náhodný výběr

  • Co to je: Populace se rozdělí na skupiny (klastry), náhodně vyberete několik klastrů a zahrnete všechny jejich členy.
  • Příklad: Máte seznam měst v kraji, náhodně vyberete 3 města a zahrnete všechny obyvatele těchto měst do výběru.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Co je to ošetření, ošetřovaná skupina, kontrolní skupina

A

**Ošetření (treatment) **je podmínka (nebo soubor podmínek), kterou výzkumník ukládá na skupinu prvků.

Skupina prvků, která obdrží ošetření, se nazývá ošetřovaná skupina - treatment group

a skupina prvků, která nedostane ošetření, se
nazývá kontrolní skupina - control group.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Randomizace

A

=postup, při kterém jsou prvky náhodně přiřazeny k
různým skupinám.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Pozorovací studie

A

Co to je: Pouze pozorujete, co se přirozeně děje, bez zásahu do průběhu.

Příklad: Sledujete, jaký vliv má kouření na zdraví lidí, aniž byste jim říkali, jestli mají kouřit nebo ne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Řízený experiment

A

Co to je: Experimentátor aktivně přiděluje účastníky do různých skupin (např. léčba vs. kontrola) a kontroluje podmínky.

Příklad: Testujete nový lék – náhodně rozdělíte pacienty na skupinu, která dostane lék, a skupinu, která dostane placebo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Výpočet relativní četnosti kategorie

A

počet výskytů v kategorii/počet všech výskytů

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Výpočet procentního zastouení kategorie

A

relativní četnost * 100

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Co jsou to surová (raw) data?

A

Data zaznamenaná v pořadí, v jakém jsou sbírána, a před tím, než jsou zpracována nebo seřazena

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Jak lze organizovat a vizualizovat surová data? (3)

A
  1. Rozložení četností
  2. Relativní četnosti a procentního zastoupení
  3. Grafická prezentace kvalitativních dat
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Co je to rozložení četností?

A

Rozložení četností kvalitativní proměnné zaznamenává počet prvků, které spadají do každé z kategorií dané proměnné.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Jak se dá provést grafická perezentace kvalitativních dat?

A

Do grafu vrazit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Jakej je rozdíl mezi sloupcovým a paretovým grafem?

A

Paretův jde sestupně

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Jak se provádí rozložení četností kvantitativních dat?

A

Pomocí stanovení tříd (intervalů) a zaznamenávání počtu hodnot, které patří do každé třídy (intervalu)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Jak se nazývají data prezentována ve formě rozložení četností

A

Seskupená data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Princip stanovení četností u kvantitativních dat (2+1)

A
  1. Vypočítání šířky třídy:
    Šířka třídy = Dolní mez následující třídy - Dolní mez aktuální třídy
  2. Výpočet středu třídy:
    Střed třídy = (Dolní mez třídy + Horní mez třídy) : 2

Jak ovšem nalézt šířku třídy?
Přibližná šířka třídy = (Nejvyšší hodnota ve vzorku - Nejmenší hodnota ve vzorku) : uvažovaný počet tříd

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Co je to histogram, kumulativni rozdeleni, steam-and-leaf rozdeleni

A
  1. Histogram je sloupcovy graf, kterej ma sloupce dotykajici se navzajem
  2. Kumulativni rozdeleni je rozdeleni, kde se to scita - jedna katagorie ma 7, 4, 2, 5, 8 —> 7, 7+4, 7+4+2, …
    procenta se taky scitaji
  3. Stem and leaf je, ze se veme prvni cislo (stem) a to tvori kategorie

Př. 72 ,52, 55

Stems: 7, 5, Leafs: 2, 2, 5

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Modus, median

A

Modus: Popisuje nejčastější hodnotu.

Medián: Popisuje střední hodnotu v pořadí, která řadu dělí na půlky

Pokud je počet hodnot sudý, medián je průměr dvou prostředních hodnot.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Co je Unimodální, Bimodální a Multimodální sada?

A

Unimodální - Datová sada pouze s jedním modem
Bimodální - Datová sada se dvěma mody
Multimodální - Datová sada s více než 2 mody

26
Q

Co je rozpětí

A

Největší - nejmenší hodnota

27
Q

Co je směrodatná odchylka

A

ukazuje jak úzce jsou hodnoty datového souboru shlukovány kolem průměru

28
Q

Kumulativní:
1. četnost
2. rozdělení četnosti
3. relativní četnost
4. procentní zastoupení

A

Kumulativní četnost a její význam

  • Kumulativní četnost: Udává celkový počet hodnot menších než horní hranice zvolené třídy.
  • Kumulativní rozdělení četnosti: Postupné sčítání četností v jednotlivých třídách, zobrazující rozložení hodnot v datech.
  • Kumulativní relativní četnost: Počet hodnot spadajících do třídy vůči celkovému počtu hodnot.
  • Kumulativní procentní zastoupení: Relativní četnost vyjádřená v procentech (podíl vynásobený 100).
29
Q

Co je to ořezání os? Proč se používá?

A

Když svislá osa začne od nějakýho čísla a ne od 0 - může deformovat graf.

zvýrazňuje rozdály a potlačuje extrémní hodnoty

30
Q

co je k% oříznutý průměr?

A

Průměr, u kterého se odstraní k % hodnot z každého konce datové řady.

31
Q

Vážený průměr?

A

Když si počítáš průměr z předmětu

32
Q

Co je to koeficient variace?

A

vyjadřuje směrodatnou odchylku jako procento
průměru a vypočítává se následovně:

33
Q

Co je to Chebyshevova věta?

A

Pro libovolné číslo k větší než 1, leží alespoň hodnot datové sady do vzdálenosti k směrodatných odchylek od průměru.

34
Q

Co říká Empirické pravidlo?

A

Pro distribuci s tvarem zvonu platí přibližně:
a) 68 % pozorování leží do 1 směr odch od prům.
b) 95 % pozorování leží do 2 směr odch od prům.
c) 99.7 % pozorování leží do 2 směr odch od prům.

34
Q

CO JSOU TO KVARTILY?
MLUV NEBO TĚ ROZČTVRTÍM!!!

A

Kvartily jsou tři shrnující ukazatele, které dělí seřazený soubor dat na čtyři stejné části. Druhý kvartil je to samé co medián datového souboru. První kvartil je hodnota středního členu mezi pozorováními, která jsou menší než medián, a třetí kvartil je hodnota středního členu mezi pozorováními, která jsou větší než medián.

Takže když řekneme, že Q1 je 6, znamená to, že prvních 25 % hodnot je menších nebo rovných 6. A podobně pro Q2 a Q3.

34
Q

Co udává rozdíl mezi 1. a 3. kvartilem?

A

Rozdíl mezi třetím a prvním kvartilem udává mezikvartilové rozpětí

IQR = Mezikvartilové rozpětí = Q3 – Q1

34
Q

Co je to percentil x percentilové pořadí

A

Percentil je konkrétní hodnota v datové sadě, která říká, kolik procent dat leží pod ní nebo na ní.

Percentilové pořadí Místo “hodnoty” nám říká procento dat, které je menší než daná hodnota.

Percentil = Hodnota, která rozděluje data (např. kolik bodů odpovídá 70 % lidí).

Percentilové pořadí = Umístění (kolik % lidí je horších nebo stejných jako ty).

34
Q

Krabicový diagram (Boxplot), co ujazuje (3)

A

Krabicový diagram (Boxplot) je grafické znázornění rozdělení datové
sady, které ukazuje její střed, rozptyl a šikmost. Je užitečný pro
vizuální identifikaci rozpětí dat, mediánu, kvartilů a odlehlých
pozorování.

34
Q

Experiment, výsledek experimentu a výběrový
prostor

A

Experiment je proces, který, když je proveden, vede k jedinému z
mnoha pozorování. Takto získaná pozorování se nazývají výsledky
experimentu
. Soubor všech výsledků pro daný experiment se nazývá výběrový prostor.

34
Q

Stromový diagram

A

Typický rozdeleni outcomu - nahore jedna, z toho dve cary, pak za kazdyho dalsi cry, atd. klasa

34
Q

Jev - co to je a dělení

A

Jev = soubor jednoho nebo více výsledků experimentu.

elementární jev
= Jev, který zahrnuje právě jeden z konečných výsledků experimentu

složený jev
= je soubor více než jednoho výsledku experimentu.

35
Q

Vlastnosti pravděpodobnosti (2)

A
  1. Pravděpodobnost jevu leží vždy v rozmezí 0-1
  2. Součet pravděpodobností všech elementárních jevů (nebo konečných výsledků) experimentu, označený Suma P(Ei), je vždy 1.
35
Q

Tři konceptuální přístupy k pravděpodobnosti

A
  1. Klasická pravděpodobnost
    = Dva nebo více výsledků, které mají stejnou pravděpodobnost výskytu, se označují jako stejně očekávatelné výsledky.
  2. Pravděpodobnost založená na relativní četnosti
    =Pokud je experiment opakován n krát a jev A je pozorován f krát, kde f je četnost, pak podle konceptu relativní četnosti pravděpodobnosti platí: f/n= P(A)
  3. Subjektivní pravděpodobnost
    = na základě subjektivního úsudku, zkušeností, informací a přesvědčení.
35
Q

Marginální x podmíněná pravděpodobnost, zápis

A

Marginální = pravděpodobnost, že se nějaký jev stane, bez jakékoliv závislosti. Zápis P(A)

Podmíněná = pravděpodobnost, že se stane jev B, pokud už se stal jev A. Zápis P (A|B)

čteme jako „pravděpodobnost nastání jevu A za předpokladu, že jev B
již nastal“.

35
Q

Doplněk jevu A

A

A¯ s carou nad hlavou
= jev, který zahrnuje všechny možné výsledky experimentu, které nejsou v A.

Jevy A a A¯ nazýváme jako komplementární jevy.

35
Q

Pravidlo pro počítání celkového počtu výsledků

A

Pokud experiment sestává ze tří kroků a první krok může mít m
výsledků, druhý krok n výsledků a třetí krok k výsledků, pak celkový
počet výsledků experimentu je m · n · k.

Příklad: Zvažte tři hody mincí. Kolik celkových výsledků tento
experiment má? –> 222=8

35
Q

Kombinace - co to je a jak na kalkulacce

A

udávají počet způsobů, jak lze vybrat x prvků z n prvků.
Čteme n nad x

nCr

35
Q

Permutace - co to je a jak na kalkulacce

A

Permutace dávají celkový počet výběrů x prvků z n (různých) prvků
tak, že je důležité pořadí výběrů.

Na kalkulačce nPr

35
Q

Co je to náhodná veličina, 2 druhy, příklad

A

Náhodná veličina je proměnná, jejíž hodnota je určena výsledkem náhodného experimentu

Diskrétní náhodná veličina
= Proměnná, která nabývá spočetné množství hodnot
Př. počet domů na ulici, počet prodejů za měsíc

Spojitá náhodná veličina
=Proměnná, která může nabývat jakékoli hodnoty obsažené v jednom nebo více intervalech
Př. Délka místnosti, Doba cesty z domova do práce

35
Q

Pravděpodobnostní rozdělení diskrétní náhodné veličiny

A

uvádí všechny možné hodnoty, které může náhodná veličina nabývat, a jejich odpovídající pravděpodobnosti.

35
Q

Střední hodnota diskrétní náhodné veličiny x

A

je hodnota, která se v průměru očekává při každém jednom opakování experimentu, pokud je tento experiment opakován hodněkrát

35
Q

Co je to binomický experiment a jaké podmínky musí splňovat (4)

A

Binomický experiment je pravděpodobnostní pokus, který splňuje následující podmínky:

  1. Pevný počet pokusů (n):
    = Experiment se provádí pevně daný početkrát.
  2. Dva možné výsledky:
    = Každý pokus má právě dva možné výsledky
  3. Stejná pravděpodobnost úspěchu (p): = Pravděpodobnost úspěchu je u každého pokusu stejná.
  4. Nezávislost pokusů:
    = Výsledek jednoho pokusu neovlivňuje výsledky ostatních pokusů.
35
Q

Kdy je binomické rozdělení:
1. Symetrické
2. Zešikmené doprava
3. Zešikmené doleva

A

Pro libovolný počet pokusů n:
1. Binomické pravděpodobnostní rozdělení je symetrické, pokud p = 0.5

  1. Binomické pravděpodobnostní rozdělení je zešikmené doprava, pokud p je menší než 0.5
  2. Binomické pravděpodobnostní rozdělení je zešikmené doleva, pokud p je větší než 0.5
35
Q

Poissonovo rozdělení pravděpodobnosti - 3 podmínky pro použití

A

Pro použití Poissonova rozdělení musí být splněny tři podmínky:
1. x je diskrétní náhodná veličina.
2. Výskyty jsou náhodné.
3. Výskyty jsou nezávislé.

35
Q

jaké 2 vlastnosti mají spojitá pravděpodobnostní rozdělení

A

Dvě vlastnosti:
1. Pravděpodobnost, že náhodná veličina x nabývá hodnoty v jakémkoli intervalu, je v rozmezí 0 až 1.

  1. Celková pravděpodobnost všech (neslučitelných) intervalů, ve kterých může náhodná veličina x nabývat hodnoty, je 1.0.
35
Q

Jaká je pravděpodobnost jedné konkrétní hodnoty x v rámci plochy pod křivkou?

A

0, nic, nothing, zipollo

35
Q

3 vlastnosti normálního rozdělení a co vytváří

A

Normální rozdělení vytváří zvonovitou křivku (Gaussovu)

3 vlastnosti křivky:
1. Celková plocha pod křivkou je 1.0.
2. Křivka je symetrická vzhledem k střední hodnotě (průměru).
3. Oba chvosty (konce) křivky se nekonečně rozšiřují

36
Q

Co je to divny protahly u v ramci normálního rozdělení?

A

Střední hodnota, zároveň ale také medián a modus

37
Q

Co je to standardizované normální rozdělení?

A

Normální rozdělení se střední hodnotou µ = 0 a směrodatnou odchylkou σ = 1

38
Q

Co je to z-hodnota (z-skóre)

A

Jednotky označené na x ose.

Udávají vzdálenost mezi průměrem a z-hodnotou ve směrodatných odchylkách

39
Q

Jaké jsou plochy pod křivkou podle směrodatných odchylek? (3)

A
  1. 68 %
  2. 95 %
  3. 99.7 %
40
Q
A