Duomenų padėtis ir sklaida Flashcards
Duomenų padėties rodikliai
vidurkis
moda
mediana
kvartiliai
moda
dažniausia duomenų aibėje pasikartojanti reikšmė
Dažnių skirstinys turintis vieną modą, vadinamas unimodiniu skirstiniu.
Jeigu dvi negretimos variacinės eilutės reikšmės pasikartoja vienodu dažniu ir
jis didesnis negu bet kurių kitų reikšmių, tai egzistuoja dvi modos.
Dažnių skirstinys – bimodinis.
Pavyzdžiui: statistinė eilutė 10; 11; 11;11; 12; 13; 14; 14; 14; 17 turi dvi modas – 11 ir 14.
Jeigu negretimų vienodo dažnio variacinės eilutės narių yra daugiau nei du, modų taip pat yra daugiau. Toks dažnių skirstinys vadinamas multimodiniu.
Galima skaičiuoti tiek kiekybinių, tiek ir kokybinių duomenų modą.
mediana
tai skaičius, perskiriantis variacinę eilutę x1, x2, …, xn, n ≤ N
į dvi maždaug lygias dalis.
Variacinė eilutė išdėstyta nemažėjimo tvarka
x(1) ≤ x(2) ≤ x(3) ≤, …, ≤ x(n)
Jeigu stebėjimų skaičius n nelyginis, tai mediana yra
variacinės eilutės reikšmė, atitinkanti (n + 1) / 2 poziciją. 𝑀𝑑 = 𝑥 𝑛+1
2
kvartiliai
skaiciai dalijantys variacinę eilutę į dvi maždaug lygias dalis
duomenų sklaidos charakteristikos
duomenų aibės plots
kvartiliu skirtumas
dispersija
standartinis nuokrypis
dispersija
parodo duomenų sklaidą aplik vidurkį exel skaičiuojama VAR()
standartinis nuokrypis
standartinis nuokrypis parodo duomenų sklaidą aplink vidurkį tais pačiais vienetais kaip ir patys duomenys. EXEL STDEV()
Standartinio nuokrypio paklaidos skaičiavimas
Standartinė paklaida SE apskaičiuojama pagal formulę: SE = STDEV()/SQRT(n),