Biostatistika Flashcards

1
Q

Stattistika je

A

Statistika je grana matematike koja obuhvata
sakupljanje, analizu, interpretaciju i prezentaciju podataka te
izradu predviđanja koja se temelje na tim podacima.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Navodno su prve statističke metode korištene čak u

A

5 vijek p.n.e.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Najstariji zapisi o korištenju statistike dolaze

A

iz 9.vijeka (arapski
naučnik Al-Kindi u svrhu izučavanja kodiranih poruka).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q
  • U 14. vijeću nastaju zapisi ………………
    sadrže niz statističkih podataka o populaciji, edukaciji i sl.
A

Nuova Cronica (istorija Firenze)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Njemačka riječ Statistik uvedena od

A

Gottfrieda Achenwalla
(1749 god.) je originalno značila analizu podataka o državi.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Pojam statistika je prvobitno izveden iz latinskog izraza
i talijanske rijeci?

A

statisticum collegium (vijeće država) te talijanske riječi statista
(državnik ili političar).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Značenje sakupljanja i analize podataka statistika je dobila
?

A

početkom 19. vijeka, a riječ je u engleski jezik uveo Sir John
Sinclair.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Vrste Statistike?

A

Deskriptivna (obuhvat cijelog statističkog skupa) i inferencijalna ( uzorak)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Deskriptivna statistika obuhvata

A

grafički prikazi, analiza relevatnih brojeva, srednje vrijednosti, mjere disperzije, mjere asimetrije, zaobljenosti, meduovisnost pojava, analiza vremenskih serija

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Sinonim za više podataka je

A

varijabla

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Šta je varijabla?

A

Pojam varijabla koristi se najčešće za skup više podataka iste
vrste.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Vrste varijabli

A

Vrste varijabli:
1. Kategorijske
2. Ordinalne (ljestvične) v
3. Metričkim ili kvantitativnim varijablama

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Kod kojih varijabli postoji a kod kojih ne, prirodni poredak

A

Kod kategorijskih ne postoji, ordinirane mogu imat ali nije precizno odredeno

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Grafički distribucije prikazujemo kao

A

stupičaste
dijagrame (bar chart) ili tzv. pite (pie chart).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Sve učestalosti varijable čine

A

distribuciju (raspodjelu) te
varijable.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Deskriptivna statistika bavi se

A

organizacijom sakupljenih podataka
te njihovim sažetim opisom pomoću numeričkih i grafičkih prikaza.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Aritmetička sredina je

A

prosječna vrijednost konačnog skupa
metričkih podataka. Ako se metrička varijabla sastoji od N podataka
(x1, x2, …, xN) aritmetička je sredina njihov zbroj podijeljen s N:

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Medijana je

A

srednja vrijednost numeričkog obilježja, koja
elemente osnovnoga skupa dijeli u dva jednaka dijela. U jednom
dijelu se nalaze elementi koji imaju vrijednost obilježja jednaku
ili manju od mediane, a u drugom dijelu se nalaze elementi koji
imaju vrijednost obilježja jednaku ili veću od medijane.
* Ako neparan broj N podataka poredamo po veličini, medijan je
(N+1)/2 po redu. Ako je broj podataka paran, ne postoji srednji
broj. Tada se medijan računa kao aritmetička sredina između dva
susjedna oko sredine.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Šta je donji kvartil a šta gornji?

A

donji kvartil je granica koja
razdvaja po veličini prvih 25% podataka od ostalih (većih), dok
je od gornjeg kvartila 75% podataka manje, a ostatak veći.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Razlika između gornjeg i donjeg kvartila zove se

A

interkvartilni
raspon i obuhvaća 50% podataka.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Finije detalje opisujemo pomoću

A

percentila. Prvi percentil
obuhvaća po veličini prvih 1% podataka, drugi 2% itd.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Vrijednost koja ima najveću učestalost je

A

mod distribucije

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Pomoću moda izražavamo

A

Pomoću moda izražavamo mjesto gdje je frekvencija najveća,
odnosno onu vrijednost , koja je u masi najčešće zastupljena.

24
Q

Kod simetričnih raspodjela šta je
jedna su te ista vrijednost.

A

aritmetička sredina, medijan i mod

25
Q

Srednja vrijednost, mod i medijan opisuju grupiranje
podataka oko središta, te se nazivaju

A

mjerama centralne
tendencije.

26
Q

Kaže se da je jedna serija potpuno kvantitativno definisana sa
najmanje tri mjere i sa tri parametra, a to su:

A

aritmetička sredina,

standardna devijacija i

broj članova te serije.

27
Q

šta je standardna devijacija?

A

Standardna devijacija pokazuje disperziju ili varijaciju
pojedinačnih vrijednosti oko aritmetičke sredine, odnosno
njihovu gustinu grupisanja.
* Standardna devijacija je kvadratni korijen iz prosječnog
kvadratnog odstupanja pojedinih članova statističke serije
od srednje aritmetičke vrijednosti.

28
Q

Koeficijent varijacije (CV)

A

je standardna
devijacija izražena u postocima od
aritmetičke sredine:

29
Q
  • Kvadrat SD zove se
A

varijanca (var):

30
Q

“Srce” statistike je simetrična, zvonolika raspodjela koju
nazivamo ?Potpuno je
određena s dva parametra:

A

normalnom ili Gaussovom raspodjelom.
. aritmetička sredina određuje os simetrije,
2. standardna devijacija podataka određuje širinu raspodjele i
njen tačan oblik.

31
Q

šta je populacija?

A

Populacija je veliki skup jedinki određenog istog svojstva

32
Q

šta je uzorak? I kad je uzorak reprezentativan

A

Uzorak je dio (podskup) populacije.
Uzorak je reprezentativan za populaciju iz koje potiče ako su
njegova prosječna svojstva uglavnom slična prosječnim
svojstvima matične populacije.

33
Q

VRSTE STATISTIČKIH ANALIZA

  • Tri su mogućnosti:
A
  1. Zanima nas samo uzorak, ne cijela populacije
  2. Ispitujemo cijelu populaciju (jednu ili više njih)
  3. Zaključujemo iz uzorka (uzoraka) na populaciju
    (populacije)
34
Q

Tri su osnovne namjene statističkih metoda:

A
  1. testiraju hipoteze (pretpostavke) o različitosti populacija
    glede nekog svojstva
  2. procjenjuju intenzitet povezanosti između dvije
    kategorijske varijable
  3. procjenjuju mogućnost predviđanja jednog svojstva
    (zavisne varijable) iz jednog ili više drugih svojstava
    (nezavisnih varijabli ili prediktora) iste populacije.
35
Q

Ovisno o vrsti ispitivanog svojstva, statističke metode koje
testiraju hipoteze dijelimo na:

A
  1. metode koje upoređuju metričke varijable (npr. t-test)
  2. metode koje upoređuju kategorijske varijable (npr. χ 2 test)
  3. za ordinalne varijable razvijeni su posebni, neparametrijski
    testovi.
    Obično metričke varijable poredimo koristeći tzv.
    parametrijske testove.
36
Q

Neparametrijske testove koristimo:

A
  1. uvijek za ordinalne varijable
  2. ponekad za metričke varijable, kada je broj podataka N mali, a
    podaci su nesimetrično distribuirani i ne mogu se
    transformirati u simetrično (normalno) raspoređene.
37
Q

nul-hipoteza je

A

Nul-hipoteza je pretpostavka da se populacije ne razlikuju u
ispitivanom obilježju, tj. da su opažene razlike slučajne (da stvarne,
populacijske razlike ne postoje).

38
Q

p vrijednost je

A

P-vrijednost je vjerojatnost dobivanja uočene ili još veće razlike na
slučajnim uzorcima iste veličine iz populacija koje se u istraživanom
obilježju ne razlikuju, tj. pod pretpostavkom da je nul-hipoteza tačna.
Što je p-vrijednost manja, to je manje vjerojatno da je nul-hipoteza
tačna, dok velika p-vrijednost sugerira prihvatljivost nul-hipoteze.

39
Q
  • 1 - p = odgovara vjerojatnosti da nul-hipoteza nije tačna, tj. da
    stvarna razlika postoji i naziva se
A

razina znacajnosti

40
Q

Razgraničenje pomoću granične razine značajnosti povlači mogućnost
grešaka u zaključivanju.

A

Alfa (α) greška (ili greška tipa 1) je odbacivanje nul-hipoteze, dok je
ona ustvari tačna.
Beta (β) greška (ili greška tipa 2) je prihvaćanje nul-hipoteze, dok je
ona u stvarnosti netačna.

41
Q

Za sve testove usporedbe populacija na osnovu uzoraka vrijedi
isto, što podrazumijeva da dobivena p-vrijednost tim je manja
(procjena je pouzdanija), što su:

A
  1. opažene razlike veće,
  2. varijabilnosti manje i
  3. uzorci veći.
42
Q
  • Postoje i određeni preduslovi za primjenu t-testa:
A
  1. Za računanje t-testa obje varijable moraju biti metričke
    (kvantitativne).
  2. Broj mjerenja mora biti zadovoljavajući (ne manje od 20),
    posebno ako su distribucije rezultata značajno nesimetrične.
43
Q

t-test je

A

t-test je jedan od najpoznatijih statističkih testova za
testiranje značajnosti razlika između dvije aritmetičke sredine.

44
Q

Izračunati rezultati za t-test se upoređuju sa vrijednostima t-testa u
posebnim tablicama, u kojima su ove vrijednosti sređene i
prikazane prema

A

stepenima slobode i nivoima vjerovatnoće.

45
Q

Kod izračunavanja t-testa mora se voditi računa o kakvim se
uzorcima radi

A

(veliki, mali, zavisni, nezavisni).

46
Q

Sljedeće su varijante t-testa:

A

a) t-test za velike nezavisne uzorke

b) t-test za male nezavisne uzorke

c) t-test za velike zavisne uzorke

d) t-test za male zavisne uzorke (metoda diferencije)

47
Q

Neparametrijskih testova ima jako puno, no najčešće navođeni u
literaturi i u pojedinim aplikacijama su:

A
  1. test sume rangova (Wilcoxonov t-test, Mann-Whitney U-
    test)
  2. medijan test
  3. test homogenog niza (Run test, Wald-Wolfowitzov test)
  4. Siegel-Tukey test
48
Q

Neparametrijske inačice testova za zavisne uzorke su:

A
  1. test predznaka (Sign test)
  2. Wilcoxonov test usklađenih parova (Wilcoxon matched
    pairs test)
49
Q

Analiza varijance je

A

Analiza varijance je statistički postupak kojim se upoređuju različite
komponente varijance (kvadrirane standardne devijacije).

50
Q

Jednostavna analiza varijance je dok je slozena analiza

A

Jednostavna analiza varijance primjenjuje se kada upoređujemo
rezultate jedne zavisne varijable unutar jedne nezavisne varijablom
koja ime više razina ili kategorija.
Složena analiza varijance je statistički postupak koji se primjenjuje u
onim slučajevima kada upoređujemo rezultate više zavisnih varijabli
unutar više nezavisnih varijabli koje imaju različite razine ili
kategorije.

51
Q

U slučaju jednostavne analizu varijance, kada želimo utvrditi
kako neka nezavisna varijabla utječe na neku zavisnu varijablu
potrebno je imati:

A

a) veći broj kategorija nezavisne varijable
b) za svaku od kategorija određeni broj ispitanika na kojima su
prikupljeni podaci o zavisnoj varijabli
c) zavisnu varijablu koja je metrička, kontinuirana varijabla

52
Q

Općenito, logika jednostavne analize varijance počiva na:

A

a) odstupanjima pojedinačnih rezultata od vlastite aritmetičke
sredine, i tu imamo variranje unutar skupine kojoj pripada
ispitanik
b) odstupanjima aritmetičkih sredina pojedinih skupina rezultata
od zajedničke aritmetičke sredine svih rezultata

53
Q

Za analizu varijance bitan je odnos variranja između i unutar
skupina. Izračunava se tzv.

A

F-vrijednost testa:

54
Q

Dakle, analiza varijance nije jednostavna metoda i uključuje niz
modela:

A

a) jednosmjerna (one-way) analiza varijance (ANOVA), s
podvrstama za nezavisne i zavisne uzorke (repeated measures
ANOVA)
b) višesmjerna (multi-way) analiza varijance
c) multifaktorska analiza varijance (MANOVA)
d) analiza varijance s kontrolom kovarijabli (ANCOVA ili
MANCOVA)

55
Q

Kada ne postoje uvjeti za korištenje parametrijske statistike, a
imamo više zavisnih uzoraka ili mjerenja, koristimo jedan od
testova neparametrijske statistike za više zavisnih uzoraka:

A
  1. Friedmanov test,
  2. Fergusonov test monotonije trenda ili
  3. Cochranov Q test.
56
Q

hi testom nastojimo sta

A

Hi-kvadrat testom nastojimo izračunati postoji li statistički
značajna povezanost u učestalostima (frekvencijama) dviju
kategorijskih varijabli, ili između dobivenih (opaženih) učestalosti i
učestalosti koje očekujemo pod određenom hipotezom.

57
Q

Hi-kvadrat test može imati sljedeća tri modaliteta:

A

hi kvadrat test za nezavisne uzorke, za zavisne, i hi kvadrat test hipoteze