Statistika Flashcards

1
Q

Charakteristiky centrální tendence?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Co je variační rozpětí?

A

R = Xmax - Xmin

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Jak spočítám rozptyl?

A

Hodnota minus populační průměr.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Jak spočítám směrodatnou odchylku?

A

Odmocním rozptyl.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Co je to variační koeficient?

A

Bezrozměrná jednotka (někdy se převádí na procenta) a určuje jak je vzorek nesourodý na hodnotách [-0,5; 0,5]

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Kdy použiji harmonický průměr?

A

Když průměruji procenta.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Kdy použiji vážený harmonický průměr?

A

Kdy průměruji procenta, která nepochází z rovnoměrných dat.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Jak je definována pravděpodobnost?

A

Jako [0-100]%. jedná se o pravdepodobnost výskytu náhodného jevu.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Co říká klasická teorie pravděpodobnosti?

A

Pravděpodobnost pokusu je vždy stejná.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Co říká statistická teorie pravděpodobnosti?

A

Že jev je závislý na příznivých a možných jevehc, tedy:

P(x) = počet příznivých jevů / počet všech možných jevů

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Co znamená průnik jevů?

A

Když jevy nastanou současně.

Px (A ∩ B) = P(A) x P(B) = 0,7 x 0,55 = 0,385 = 35,5%

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Co je sjednocení jevů?

A

Sloučení dvou jevů do jednoho.

Px (A ∪ B) = ( P(A) + P(B) ) - P (A ∩ B) = (0,7 + 0,55) - (0,7 x 0,55) = 1,25 - 0,385 = 0,865 = 86,5 %

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Co je to normální veličina a jak se spočítá?

A

Odpovídá normální rozložení parametrů v populaci.

Jedna z klasických normální veličin je Z skór.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Co je konfidenční interval?

A

Přesnost, se kterou udáváme interval spolehlivosti.

95% klasicky p < 0,05

1 - α - chyba odhadu = 1 - 0,95 = 0,5% možné chyby

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Co je to t test?

A

Součást inferenční statistiky. udává pravděpodobnost, že jevy A a b jsou rozdílné, tedy, že pochází z jiné populace. Porovnává rozptyly skupin.

t = rozptyl mezi skupinami / rozptyl skupin

Je třeba 20-30 vzorků do skupiny.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Jaké jsou typy t testů?

A
  1. nezávislé - Mann-Whitney U test
  2. párové - Wilcoxon t test (data pochází ze stejného vzorku)
  3. individuální - porovnání vzorku s populací
17
Q

Jak vypadá výstup t testu?

A

Testosterol produkuje cholestrol t(99) = 0,33, p = 0,37, ale nebyl zjištěný signifikantní rozdíl (testosterol M = 34, kontrolní M = 36).

99 = df

t = hodnota t testu

p hodnota (kritická hodnota)

M - průměr

18
Q

Co je to ANOVA?

A

Zjišťuje rozdíly mezi skupinami (dva a více skupin) porovnáváním průměrů.

SSW - suma čtverců skupin

SST - celková suma čtverců

SSB - suma čtvrců mezi skupinami

SSB / df = 101,667

SSW / df = 54 / 14 = 4,5

F = ( SSB / df ) / ( SSW / df ) = 22,59 > kritická hodnota 3,39

Zápis:

F(2,12) = 22,59, p < 0,05

2 = df ( n - 1)

12 = df celkem - skupin ( n - sk)

19
Q

Jak spočítám X2 chi-kvadrát?

A

Naměřené minus očekávané na druhou děleno očekáváné

df = n - 1

Jak přesáhne kritickou mez - zamítám H0

20
Q

Co je matematická regrese?

A

Když spolu dvě proměnné korelují a můžeme z jedné proměnné odhadovat druhou proměnnou.

21
Q

Typy matematických regresí.

A
  1. jednoduchá regrese - predikce jedné proměnné další jedno proměnnou
  2. mnohonásobná regrese - predikce jedné proměnné pomocí více proměnných
  3. lineární regrese - rovnice daná součtem násobků jedné proměnné
  4. log-lineární regrese - predikuje kvantitativní proměnnou na základě kvalitativní proměnné - zařazeno napříkald pozorování pro zlepšení odhadu
22
Q

jaké uvádět statistiky centrální tendence?

A
  1. průměr - pokud rozložení není příliš šikmé
  2. modus - pokud je křivka multimodální
  3. medián - pokud je křivka šikmá a unimodální
23
Q

Jak převedu Z skór na hrubý skór?

A

Musím znát hodnotu směrodatné odhcylky a průměru.

m = 100; s = 15

Spočítejte pro osobu Z = -3 IQ.

X = Z x s + m = -3 x 15 + 100 = 55

24
Q

Co je to centrální limitní teorém?

A

Pro každou populaci o průměru μ a směrodatné odchylce σ se bude rozdělení výběrových průměrů výběru (pro rozsah výběru jdoucí do nekonečna) blížit normálnímu rozložení s průměrem m a směrodatnou odchylkou σx = σ√n.

25
Q

Co znamená mnohonásobná porovnání u ANOVA?

A

F statistika řekne, že existuje rozdíl mezi skupinami, ale neřekne mezi kterými. Je tedy potřeba provést multiple comparison nebo post-hoc test.

Jsou to v podtsatě upravené t testy

Fisherův LSD test, Bonferoniho test, Tukeyho test, Schefeho test…

Upravují hladinu významnosti -Fisherův LSD test je liberálnější, naopak ostatní testy jsou přísnější.

26
Q

Míry založené na chí-kvadrátu.

A

Fí koeficient - užívá se pro 2x2 design v dichotomických otázkách (napříkald pohlaví) - hodnota X2 se vydělí počtem osob a výsledek se odmocní

Cramerovo V - podobně jako Fí; počet osob se navíc násobí početem řádků -1< používá se na věší deisgny

27
Q

Co ovlivňuje statistickou sílu? Power statistics.

A
  1. hladina významnosti
  2. síla testu
  3. velikost účinku
  4. rozsah výběrového vzorku
  • pokud známe alepsoň tři z nich, dá se dopočítat zbývající porametr
28
Q

Co znamená velikost účinku?

A

Čím je rozdíl mezi populačními průměry vyšší, tím větší je pravděpodobnost, že najdeme i rozdíl mezi průměry vzorků.

29
Q

Požadovaná velikost vzorku?

A

Nejprve se rozhodnu, jaký nejmenší účinke pokládám za klinicky významný.

Často se počítá Cohenův koeficient účinku d - označuje se jako effect size

d < 0,20 = malý účinek (r = 0,10)

d = 0,50 = střední (r = 0,243)

d > 0,80 = velký (r = 0,371)

Vše ovšem závisí na kontextu, musíme odhadnout i variabilitu znaku v populaci σ (z předchozích studií, z pilotáže…), stanovit hladinu významnosti (obvykle a = 0,05) a nakonec sílu testu (mion. 90%) - jakou chceme mít pravděpodobnost, že pokud rozdíl existuje, že ho prokážeme?