Statistika Flashcards by Michael Tesař

Charakteristiky centrální tendence?

How well did you know this?

Not at all

Perfectly

Co je variační rozpětí?

R = X_max- X_min

How well did you know this?

Not at all

Perfectly

Jak spočítám rozptyl?

Hodnota minus populační průměr.

How well did you know this?

Not at all

Perfectly

Jak spočítám směrodatnou odchylku?

Odmocním rozptyl.

How well did you know this?

Not at all

Perfectly

Co je to variační koeficient?

Bezrozměrná jednotka (někdy se převádí na procenta) a určuje jak je vzorek nesourodý na hodnotách [-0,5; 0,5]

How well did you know this?

Not at all

Perfectly

Kdy použiji harmonický průměr?

Když průměruji procenta.

How well did you know this?

Not at all

Perfectly

Kdy použiji vážený harmonický průměr?

Kdy průměruji procenta, která nepochází z rovnoměrných dat.

How well did you know this?

Not at all

Perfectly

Jak je definována pravděpodobnost?

Jako [0-100]%. jedná se o pravdepodobnost výskytu náhodného jevu.

How well did you know this?

Not at all

Perfectly

Co říká klasická teorie pravděpodobnosti?

Pravděpodobnost pokusu je vždy stejná.

How well did you know this?

Not at all

Perfectly

Co říká statistická teorie pravděpodobnosti?

Že jev je závislý na příznivých a možných jevehc, tedy:

P(x) = počet příznivých jevů / počet všech možných jevů

How well did you know this?

Not at all

Perfectly

Co znamená průnik jevů?

Když jevy nastanou současně.

P_x(A ∩ B) = P(A) x P(B) = 0,7 x 0,55 = 0,385 = 35,5%

How well did you know this?

Not at all

Perfectly

Co je sjednocení jevů?

Sloučení dvou jevů do jednoho.

P_x (A ∪ B) = ( P(A) + P(B) ) - P (A ∩ B) = (0,7 + 0,55) - (0,7 x 0,55) = 1,25 - 0,385 = 0,865 = 86,5 %

How well did you know this?

Not at all

Perfectly

Co je to normální veličina a jak se spočítá?

Odpovídá normální rozložení parametrů v populaci.

Jedna z klasických normální veličin je Z skór.

How well did you know this?

Not at all

Perfectly

Co je konfidenční interval?

Přesnost, se kterou udáváme interval spolehlivosti.

95% klasicky p < 0,05

1 - α - chyba odhadu = 1 - 0,95 = 0,5% možné chyby

How well did you know this?

Not at all

Perfectly

Co je to t test?

Součást inferenční statistiky. udává pravděpodobnost, že jevy A a b jsou rozdílné, tedy, že pochází z jiné populace. Porovnává rozptyly skupin.

t = rozptyl mezi skupinami / rozptyl skupin

Je třeba 20-30 vzorků do skupiny.

How well did you know this?

Not at all

Perfectly

Jaké jsou typy t testů?

nezávislé - Mann-Whitney U test
párové - Wilcoxon t test (data pochází ze stejného vzorku)
individuální - porovnání vzorku s populací

Jak vypadá výstup t testu?

Testosterol produkuje cholestrol t(99) = 0,33, p = 0,37, ale nebyl zjištěný signifikantní rozdíl (testosterol M = 34, kontrolní M = 36).

99 = df

t = hodnota t testu

p hodnota (kritická hodnota)

M - průměr

Co je to ANOVA?

Zjišťuje rozdíly mezi skupinami (dva a více skupin) porovnáváním průměrů.

SSW - suma čtverců skupin

SST - celková suma čtverců

SSB - suma čtvrců mezi skupinami

SSB / df = 101,667

SSW / df = 54 / 14 = 4,5

F = ( SSB / df ) / ( SSW / df ) = 22,59 > kritická hodnota 3,39

Zápis:

F(2,12) = 22,59, p < 0,05

2 = df ( n - 1)

12 = df celkem - skupin ( n - sk)

Jak spočítám X² chi-kvadrát?

Naměřené minus očekávané na druhou děleno očekáváné

df = n - 1

Jak přesáhne kritickou mez - zamítám H₀

Co je matematická regrese?

Když spolu dvě proměnné korelují a můžeme z jedné proměnné odhadovat druhou proměnnou.

Typy matematických regresí.

jednoduchá regrese - predikce jedné proměnné další jedno proměnnou
mnohonásobná regrese - predikce jedné proměnné pomocí více proměnných
lineární regrese - rovnice daná součtem násobků jedné proměnné
log-lineární regrese - predikuje kvantitativní proměnnou na základě kvalitativní proměnné - zařazeno napříkald pozorování pro zlepšení odhadu

jaké uvádět statistiky centrální tendence?

průměr - pokud rozložení není příliš šikmé
modus - pokud je křivka multimodální
medián - pokud je křivka šikmá a unimodální

Jak převedu Z skór na hrubý skór?

Musím znát hodnotu směrodatné odhcylky a průměru.

m = 100; s = 15

Spočítejte pro osobu Z = -3 IQ.

X = Z x s + m = -3 x 15 + 100 = 55

Co je to centrální limitní teorém?

Pro každou populaci o průměru μ a směrodatné odchylce σ se bude rozdělení výběrových průměrů výběru (pro rozsah výběru jdoucí do nekonečna) blížit normálnímu rozložení s průměrem m a směrodatnou odchylkou σ_x = σ√n.

Co znamená **mnohonásobná porovnání** u ANOVA?

F statistika řekne, že existuje rozdíl mezi skupinami, ale neřekne mezi kterými. Je tedy potřeba provést multiple comparison nebo post-hoc test. Jsou to v podtsatě upravené t testy Fisherův LSD test, Bonferoniho test, Tukeyho test, Schefeho test... Upravují hladinu významnosti -Fisherův LSD test je liberálnější, naopak ostatní testy jsou přísnější.

Míry založené na chí-kvadrátu.

**Fí koeficient** - užívá se pro 2x2 design v dichotomických otázkách (napříkald pohlaví) - hodnota X₂ se vydělí počtem osob a výsledek se odmocní **Cramerovo V** - podobně jako Fí; počet osob se navíc násobí početem řádků -1\< používá se na věší deisgny

Co ovlivňuje **statistickou sílu? Power statistics.**

1. hladina významnosti 2. síla testu 3. velikost účinku 4. rozsah výběrového vzorku - pokud známe alepsoň tři z nich, dá se dopočítat zbývající porametr

Co znamená **velikost účinku**?

Čím je rozdíl mezi populačními průměry vyšší, tím větší je pravděpodobnost, že najdeme i rozdíl mezi průměry vzorků.

Požadovaná **velikost vzorku**?

Nejprve se rozhodnu, jaký nejmenší účinke pokládám za klinicky významný. Často se počítá Cohenův koeficient účinku d - označuje se jako **effect size** d \< 0,20 = malý účinek (r = 0,10) d = 0,50 = střední (r = 0,243) d \> 0,80 = velký (r = 0,371) Vše ovšem závisí na kontextu, musíme odhadnout i variabilitu znaku v populaci σ (z předchozích studií, z pilotáže...), stanovit hladinu významnosti (obvykle a = 0,05) a nakonec sílu testu (mion. 90%) - jakou chceme mít pravděpodobnost, že pokud rozdíl existuje, že ho prokážeme?