6. predavanje: Prvi pogled na podatke Flashcards
Navesti mjere središnje vrijednosti za određivanje karakteristika konkretnog uzorka.
Aritmetička sredina, zajednička aritmetička sredina, centralna vrijednost (medijan), dominantna vrijednost, geometrijska sredina, harmonijska sredina.
Koji je značaj aritmetičke sredine, M?
Pokazatelj je prave vrijednosti mjerenja uz dovoljan broj rezultata (najmanje 30), jednake uvjete mjerenja i distribucija rezultat mora biti normalna.
Što sve utječe na rezultate mjerenja (prilikom izračuna aritmetičke sredine)?
Nesistematski i sistematski varijabilni faktori.
Navesti izraz za izračun zajedničke aritmetičke sredine.
Mzaj = (M1N1 + M2N2 + … + MnNn) / (N1 + N2 + … + Nn)
Što je i kada se koristi centralna vrijednost (medijan) C?
Vrijednost koja se u nizu rezultata poredanih po veličini nalazi točno u sredini. Koristi se ako u nizu rezltata imamo neku ekstremno veliku ili malu vrijednost ili je distribucija rezultata simetrična.
Definirati dominantnu vrijednost (mod) D.
Vrijednost koja je u nizu mjerenja najčešće postignuta.
Definirati geometrijsku sredinu, G.
Mjera prosječne brzine neke promjene.
- pow(X1X2…*Xn, 1/n)
Definirati harmonijsku sredinu, H.
Prosjek nekih odnosa, npr. prosječni kilometri na sat.
- H = N / sum_i(1/Xi)
Navesti mjere varijabilnosti za određivanje karakteristika konkretnog uzorka.
- Raspon rezultata: razlika između najvećeg i
najmanjeg rezultata - Srednje odstupanje: sum_i(Xi-M) / N
- Varijanca: sum_i(Xi-M)^2 / (N-1)
- Standardna devijacija: sqrt(varijanca)
- Poluinterkvartalno raspršenje: (Q3 - Q1) / 2
- Koeficijent varijabilnosti: (SD / M) * 100, da bi se
mogle uspoređivati varijabilnosti različitih
pojava i svojstava
Definirati indeks asimetrije.
- alpha = 3 (M-C) / SD
- alpha > 0: pozitivno asimetričma distribucija
- alpha < 0: negativno asimetrična distribucija
Navesti pretpostavke normalne distribucije.
- postoji prava vrijednost mjerenja
- pri mjerenju prave vrijednosti djeluju samo
nesistematski varijabilni faktori - radi se veliki broj mjerenja
- mjerenja provedena jednakom metodom
Navesti izraz kojim se računa z-vrijednost.
z = (X - M) / SD
Koji je cilj inferencijalne statistike?
Iz uzorka stvoriti zaključak o populaciji.
Definirati statističku jedinicu.
Statistička jedinica je jedinica nad kojom se obavlja mjerenje (npr. osoba, grupa ljudi, razred, proizvod, tvornica).
Definirati uzorak.
Manji broj definiranih sstatističkih jedinica ili elemenata koji čine veću cjelinu (populaciju).
Definirati populaciju.
Sve statističke jedinice.
Navesti i objasniti vrste uzoraka.
- Slučajni: ima normalnu razdiobu
- Pristrani: neki uzorak ima veću šansu biti
izabran - Neslučajan: korišten iz praktičnih razloga
(studenti, bolesnici, dobrovoljni sudionici)
Nabrojati pristupe za generiranje slučajnog broja.
- Fizikalne metode
- Računske metode
- Metode temeljene na ljudima
Definirati frakciju uzorka.
- f = n / N
- n: veličina slučajno odabranog uzorka
- N: veličina populacije (broj statističkih jedinica)
Navesti vrste slučajnih uzoraka.
- stratificirani/slojeviti: populacija se dijeli u
potpopulacije (stratume) prema nekim
karakteristikama i iz svake grupe se uzima
slučajni uzorak koji čuva udio stratuma u
populaciji - klaster slučajni
- sistematski slučajni
Navesti vrste neslučajnih uzoraka.
- Prigodni: uzorak koji se nađe pri ruci
- Namjerni/svrhoviti: uzeti radi određenog cilja
- Modalni: najčešći ili tipični slučajevi
- Uzorak eksperata: stručnjaci u nekom
području - Kvota uzorak: proporcionalni i
neproporcionalni - Uzorak heterogenosti
- Uzorak snježne grude
Definirati i objasniti teorem centralne granice.
Za određenu populaciju s aritmetičkom sredinom µ i varijancom σ^2, distribucija aritmetičkih sredina uzoraka imat će:
- aritmetičku sredinu M_M = µ
- varijancu SD^2 = σ^2 / N
- std. devijaciju SD_M = σ / sqrt(N).
Distribucija aritmetičkih sredina uzoraka približava se normalnoj razdiobi kako N uzorka raste.
Navesti izraz za standardnu pogrešku aritemtičke sredine.
SD_M = SD / sqrt(N)
Definirati granice puzdanosti.
Interval dobiven iz standardne pogreške aritmetičke sredine.
- M +- {1,2,3}SD_M
Navesti izraz za standardnu pogrešku razlike.
SD_M1-M2 = sqrt(SD_1^2/N1 + SD_2^2/N2)
Definirati i navesti izraz za izračun t-odnosa.
t-odnos računa koliko je puta razlika veća od svoje pogreške.
- t = (M1 - M2) / SD_M1-M2
Objasniti pojam nul-hipoteze.
Nuk-hipoteza tvrdi da ne postoji razlika - nema (statistički značajne) razlike među pojavama koje mjerimo.