Biostatistika Flashcards

1
Q

Stattistika je

A

Statistika je grana matematike koja obuhvata
sakupljanje, analizu, interpretaciju i prezentaciju podataka te
izradu predviđanja koja se temelje na tim podacima.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Navodno su prve statističke metode korištene čak u

A

5 vijek p.n.e.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Najstariji zapisi o korištenju statistike dolaze

A

iz 9.vijeka (arapski
naučnik Al-Kindi u svrhu izučavanja kodiranih poruka).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q
  • U 14. vijeću nastaju zapisi ………………
    sadrže niz statističkih podataka o populaciji, edukaciji i sl.
A

Nuova Cronica (istorija Firenze)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Njemačka riječ Statistik uvedena od

A

Gottfrieda Achenwalla
(1749 god.) je originalno značila analizu podataka o državi.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Pojam statistika je prvobitno izveden iz latinskog izraza
i talijanske rijeci?

A

statisticum collegium (vijeće država) te talijanske riječi statista
(državnik ili političar).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Značenje sakupljanja i analize podataka statistika je dobila
?

A

početkom 19. vijeka, a riječ je u engleski jezik uveo Sir John
Sinclair.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Vrste Statistike?

A

Deskriptivna (obuhvat cijelog statističkog skupa) i inferencijalna ( uzorak)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Deskriptivna statistika obuhvata

A

grafički prikazi, analiza relevatnih brojeva, srednje vrijednosti, mjere disperzije, mjere asimetrije, zaobljenosti, meduovisnost pojava, analiza vremenskih serija

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Sinonim za više podataka je

A

varijabla

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Šta je varijabla?

A

Pojam varijabla koristi se najčešće za skup više podataka iste
vrste.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Vrste varijabli

A

Vrste varijabli:
1. Kategorijske
2. Ordinalne (ljestvične) v
3. Metričkim ili kvantitativnim varijablama

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Kod kojih varijabli postoji a kod kojih ne, prirodni poredak

A

Kod kategorijskih ne postoji, ordinirane mogu imat ali nije precizno odredeno

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Grafički distribucije prikazujemo kao

A

stupičaste
dijagrame (bar chart) ili tzv. pite (pie chart).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Sve učestalosti varijable čine

A

distribuciju (raspodjelu) te
varijable.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Deskriptivna statistika bavi se

A

organizacijom sakupljenih podataka
te njihovim sažetim opisom pomoću numeričkih i grafičkih prikaza.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Aritmetička sredina je

A

prosječna vrijednost konačnog skupa
metričkih podataka. Ako se metrička varijabla sastoji od N podataka
(x1, x2, …, xN) aritmetička je sredina njihov zbroj podijeljen s N:

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Medijana je

A

srednja vrijednost numeričkog obilježja, koja
elemente osnovnoga skupa dijeli u dva jednaka dijela. U jednom
dijelu se nalaze elementi koji imaju vrijednost obilježja jednaku
ili manju od mediane, a u drugom dijelu se nalaze elementi koji
imaju vrijednost obilježja jednaku ili veću od medijane.
* Ako neparan broj N podataka poredamo po veličini, medijan je
(N+1)/2 po redu. Ako je broj podataka paran, ne postoji srednji
broj. Tada se medijan računa kao aritmetička sredina između dva
susjedna oko sredine.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Šta je donji kvartil a šta gornji?

A

donji kvartil je granica koja
razdvaja po veličini prvih 25% podataka od ostalih (većih), dok
je od gornjeg kvartila 75% podataka manje, a ostatak veći.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Razlika između gornjeg i donjeg kvartila zove se

A

interkvartilni
raspon i obuhvaća 50% podataka.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Finije detalje opisujemo pomoću

A

percentila. Prvi percentil
obuhvaća po veličini prvih 1% podataka, drugi 2% itd.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Vrijednost koja ima najveću učestalost je

A

mod distribucije

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Pomoću moda izražavamo

A

Pomoću moda izražavamo mjesto gdje je frekvencija najveća,
odnosno onu vrijednost , koja je u masi najčešće zastupljena.

24
Q

Kod simetričnih raspodjela šta je
jedna su te ista vrijednost.

A

aritmetička sredina, medijan i mod

25
Srednja vrijednost, mod i medijan opisuju grupiranje podataka oko središta, te se nazivaju
mjerama centralne tendencije.
26
Kaže se da je jedna serija potpuno kvantitativno definisana sa najmanje tri mjere i sa tri parametra, a to su:
aritmetička sredina, standardna devijacija i broj članova te serije.
27
šta je standardna devijacija?
Standardna devijacija pokazuje disperziju ili varijaciju pojedinačnih vrijednosti oko aritmetičke sredine, odnosno njihovu gustinu grupisanja. * Standardna devijacija je kvadratni korijen iz prosječnog kvadratnog odstupanja pojedinih članova statističke serije od srednje aritmetičke vrijednosti.
28
Koeficijent varijacije (CV)
je standardna devijacija izražena u postocima od aritmetičke sredine:
29
* Kvadrat SD zove se
varijanca (var):
30
“Srce” statistike je simetrična, zvonolika raspodjela koju nazivamo ?Potpuno je određena s dva parametra:
normalnom ili Gaussovom raspodjelom. . aritmetička sredina određuje os simetrije, 2. standardna devijacija podataka određuje širinu raspodjele i njen tačan oblik.
31
šta je populacija?
Populacija je veliki skup jedinki određenog istog svojstva
32
šta je uzorak? I kad je uzorak reprezentativan
Uzorak je dio (podskup) populacije. Uzorak je reprezentativan za populaciju iz koje potiče ako su njegova prosječna svojstva uglavnom slična prosječnim svojstvima matične populacije.
33
VRSTE STATISTIČKIH ANALIZA * Tri su mogućnosti:
1. Zanima nas samo uzorak, ne cijela populacije 2. Ispitujemo cijelu populaciju (jednu ili više njih) 3. Zaključujemo iz uzorka (uzoraka) na populaciju (populacije)
34
Tri su osnovne namjene statističkih metoda:
1. testiraju hipoteze (pretpostavke) o različitosti populacija glede nekog svojstva 2. procjenjuju intenzitet povezanosti između dvije kategorijske varijable 3. procjenjuju mogućnost predviđanja jednog svojstva (zavisne varijable) iz jednog ili više drugih svojstava (nezavisnih varijabli ili prediktora) iste populacije.
35
Ovisno o vrsti ispitivanog svojstva, statističke metode koje testiraju hipoteze dijelimo na:
1. metode koje upoređuju metričke varijable (npr. t-test) 2. metode koje upoređuju kategorijske varijable (npr. χ 2 test) 3. za ordinalne varijable razvijeni su posebni, neparametrijski testovi. Obično metričke varijable poredimo koristeći tzv. parametrijske testove.
36
Neparametrijske testove koristimo:
1. uvijek za ordinalne varijable 2. ponekad za metričke varijable, kada je broj podataka N mali, a podaci su nesimetrično distribuirani i ne mogu se transformirati u simetrično (normalno) raspoređene.
37
nul-hipoteza je
Nul-hipoteza je pretpostavka da se populacije ne razlikuju u ispitivanom obilježju, tj. da su opažene razlike slučajne (da stvarne, populacijske razlike ne postoje).
38
p vrijednost je
P-vrijednost je vjerojatnost dobivanja uočene ili još veće razlike na slučajnim uzorcima iste veličine iz populacija koje se u istraživanom obilježju ne razlikuju, tj. pod pretpostavkom da je nul-hipoteza tačna. Što je p-vrijednost manja, to je manje vjerojatno da je nul-hipoteza tačna, dok velika p-vrijednost sugerira prihvatljivost nul-hipoteze.
39
* 1 - p = odgovara vjerojatnosti da nul-hipoteza nije tačna, tj. da stvarna razlika postoji i naziva se
razina znacajnosti
40
Razgraničenje pomoću granične razine značajnosti povlači mogućnost grešaka u zaključivanju.
Alfa (α) greška (ili greška tipa 1) je odbacivanje nul-hipoteze, dok je ona ustvari tačna. Beta (β) greška (ili greška tipa 2) je prihvaćanje nul-hipoteze, dok je ona u stvarnosti netačna.
41
Za sve testove usporedbe populacija na osnovu uzoraka vrijedi isto, što podrazumijeva da dobivena p-vrijednost tim je manja (procjena je pouzdanija), što su:
1. opažene razlike veće, 2. varijabilnosti manje i 3. uzorci veći.
42
* Postoje i određeni preduslovi za primjenu t-testa:
1. Za računanje t-testa obje varijable moraju biti metričke (kvantitativne). 2. Broj mjerenja mora biti zadovoljavajući (ne manje od 20), posebno ako su distribucije rezultata značajno nesimetrične.
43
t-test je
t-test je jedan od najpoznatijih statističkih testova za testiranje značajnosti razlika između dvije aritmetičke sredine.
44
Izračunati rezultati za t-test se upoređuju sa vrijednostima t-testa u posebnim tablicama, u kojima su ove vrijednosti sređene i prikazane prema
stepenima slobode i nivoima vjerovatnoće.
45
Kod izračunavanja t-testa mora se voditi računa o kakvim se uzorcima radi
(veliki, mali, zavisni, nezavisni).
46
Sljedeće su varijante t-testa:
a) t-test za velike nezavisne uzorke b) t-test za male nezavisne uzorke c) t-test za velike zavisne uzorke d) t-test za male zavisne uzorke (metoda diferencije)
47
Neparametrijskih testova ima jako puno, no najčešće navođeni u literaturi i u pojedinim aplikacijama su:
1. test sume rangova (Wilcoxonov t-test, Mann-Whitney U- test) 2. medijan test 3. test homogenog niza (Run test, Wald-Wolfowitzov test) 4. Siegel-Tukey test
48
Neparametrijske inačice testova za zavisne uzorke su:
1. test predznaka (Sign test) 2. Wilcoxonov test usklađenih parova (Wilcoxon matched pairs test)
49
Analiza varijance je
Analiza varijance je statistički postupak kojim se upoređuju različite komponente varijance (kvadrirane standardne devijacije).
50
Jednostavna analiza varijance je dok je slozena analiza
Jednostavna analiza varijance primjenjuje se kada upoređujemo rezultate jedne zavisne varijable unutar jedne nezavisne varijablom koja ime više razina ili kategorija. Složena analiza varijance je statistički postupak koji se primjenjuje u onim slučajevima kada upoređujemo rezultate više zavisnih varijabli unutar više nezavisnih varijabli koje imaju različite razine ili kategorije.
51
U slučaju jednostavne analizu varijance, kada želimo utvrditi kako neka nezavisna varijabla utječe na neku zavisnu varijablu potrebno je imati:
a) veći broj kategorija nezavisne varijable b) za svaku od kategorija određeni broj ispitanika na kojima su prikupljeni podaci o zavisnoj varijabli c) zavisnu varijablu koja je metrička, kontinuirana varijabla
52
Općenito, logika jednostavne analize varijance počiva na:
a) odstupanjima pojedinačnih rezultata od vlastite aritmetičke sredine, i tu imamo variranje unutar skupine kojoj pripada ispitanik b) odstupanjima aritmetičkih sredina pojedinih skupina rezultata od zajedničke aritmetičke sredine svih rezultata
53
Za analizu varijance bitan je odnos variranja između i unutar skupina. Izračunava se tzv.
F-vrijednost testa:
54
Dakle, analiza varijance nije jednostavna metoda i uključuje niz modela:
a) jednosmjerna (one-way) analiza varijance (ANOVA), s podvrstama za nezavisne i zavisne uzorke (repeated measures ANOVA) b) višesmjerna (multi-way) analiza varijance c) multifaktorska analiza varijance (MANOVA) d) analiza varijance s kontrolom kovarijabli (ANCOVA ili MANCOVA)
55
Kada ne postoje uvjeti za korištenje parametrijske statistike, a imamo više zavisnih uzoraka ili mjerenja, koristimo jedan od testova neparametrijske statistike za više zavisnih uzoraka:
1. Friedmanov test, 2. Fergusonov test monotonije trenda ili 3. Cochranov Q test.
56
hi testom nastojimo sta
Hi-kvadrat testom nastojimo izračunati postoji li statistički značajna povezanost u učestalostima (frekvencijama) dviju kategorijskih varijabli, ili između dobivenih (opaženih) učestalosti i učestalosti koje očekujemo pod određenom hipotezom.
57
Hi-kvadrat test može imati sljedeća tri modaliteta:
hi kvadrat test za nezavisne uzorke, za zavisne, i hi kvadrat test hipoteze