Biostatistika Flashcards
Stattistika je
Statistika je grana matematike koja obuhvata
sakupljanje, analizu, interpretaciju i prezentaciju podataka te
izradu predviđanja koja se temelje na tim podacima.
Navodno su prve statističke metode korištene čak u
5 vijek p.n.e.
Najstariji zapisi o korištenju statistike dolaze
iz 9.vijeka (arapski
naučnik Al-Kindi u svrhu izučavanja kodiranih poruka).
- U 14. vijeću nastaju zapisi ………………
sadrže niz statističkih podataka o populaciji, edukaciji i sl.
Nuova Cronica (istorija Firenze)
Njemačka riječ Statistik uvedena od
Gottfrieda Achenwalla
(1749 god.) je originalno značila analizu podataka o državi.
Pojam statistika je prvobitno izveden iz latinskog izraza
i talijanske rijeci?
statisticum collegium (vijeće država) te talijanske riječi statista
(državnik ili političar).
Značenje sakupljanja i analize podataka statistika je dobila
?
početkom 19. vijeka, a riječ je u engleski jezik uveo Sir John
Sinclair.
Vrste Statistike?
Deskriptivna (obuhvat cijelog statističkog skupa) i inferencijalna ( uzorak)
Deskriptivna statistika obuhvata
grafički prikazi, analiza relevatnih brojeva, srednje vrijednosti, mjere disperzije, mjere asimetrije, zaobljenosti, meduovisnost pojava, analiza vremenskih serija
Sinonim za više podataka je
varijabla
Šta je varijabla?
Pojam varijabla koristi se najčešće za skup više podataka iste
vrste.
Vrste varijabli
Vrste varijabli:
1. Kategorijske
2. Ordinalne (ljestvične) v
3. Metričkim ili kvantitativnim varijablama
Kod kojih varijabli postoji a kod kojih ne, prirodni poredak
Kod kategorijskih ne postoji, ordinirane mogu imat ali nije precizno odredeno
Grafički distribucije prikazujemo kao
stupičaste
dijagrame (bar chart) ili tzv. pite (pie chart).
Sve učestalosti varijable čine
distribuciju (raspodjelu) te
varijable.
Deskriptivna statistika bavi se
organizacijom sakupljenih podataka
te njihovim sažetim opisom pomoću numeričkih i grafičkih prikaza.
Aritmetička sredina je
prosječna vrijednost konačnog skupa
metričkih podataka. Ako se metrička varijabla sastoji od N podataka
(x1, x2, …, xN) aritmetička je sredina njihov zbroj podijeljen s N:
Medijana je
srednja vrijednost numeričkog obilježja, koja
elemente osnovnoga skupa dijeli u dva jednaka dijela. U jednom
dijelu se nalaze elementi koji imaju vrijednost obilježja jednaku
ili manju od mediane, a u drugom dijelu se nalaze elementi koji
imaju vrijednost obilježja jednaku ili veću od medijane.
* Ako neparan broj N podataka poredamo po veličini, medijan je
(N+1)/2 po redu. Ako je broj podataka paran, ne postoji srednji
broj. Tada se medijan računa kao aritmetička sredina između dva
susjedna oko sredine.
Šta je donji kvartil a šta gornji?
donji kvartil je granica koja
razdvaja po veličini prvih 25% podataka od ostalih (većih), dok
je od gornjeg kvartila 75% podataka manje, a ostatak veći.
Razlika između gornjeg i donjeg kvartila zove se
interkvartilni
raspon i obuhvaća 50% podataka.
Finije detalje opisujemo pomoću
percentila. Prvi percentil
obuhvaća po veličini prvih 1% podataka, drugi 2% itd.
Vrijednost koja ima najveću učestalost je
mod distribucije