Preizkusi domnev o artimetičnih sredinah Flashcards

1
Q

Kakšen test uporabimo, ko imamo en vzorec? Kakšne hipoteze lahko preverimo? Opiši test in katere predpostavke so potrebne, da ta test lahko uporabimo. Obstajajo kakšni neparametrični ekvivalenti temu testu?

A

T-test za en vzore nam pove ali obstaja statistično značilna razlika med dejanskim povprečjem in hipotetičnim povprečjem, ki ga sami določimo. Ta test je primerjava vzorčne aritmetične sredine z znano populacijsko aritmetično sredino (c)

Predpostavke: normalna porazdelitev, odvisne spremenljivke so na intervalnem ali razmernostnem nivoju
Hipoteze= H0: μ = c; H1: μ ≠ c (dvosmerno); μ > c ali μ < c (enosmerno).
Neparametrični ekvivalenti tega testa ne obstajajo.

Na primer, da računamo t test za en vzorec med povprečjem telesne višine ljudi iz
Maribora in hipotetično telesno višino, ki pa je slovensko povprečje. Ugotovili bomo ali se povprečje telesne višine ljudi iz Maribora statistično pomembno razlikuje od povprečne slovenske telesne višine.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Kakšen test uporabimo, ko imamo dva neodvisna vzorca? Kakšne hipoteze lahko preverimo? Opiši test in katere predpostavke so potrebne, da ta test lahko uporabimo. Obstajajo kakšni neparametrični ekvivalenti temu testu?

A

**T-test za neodvisne vzorce **nam pove ali se dve neodvisni skupini med seboj v povprečju **statistično značilno razlikujeta. ** Ta test je primerjava med dvema neodvisnima skupinama (različne enote)

Predpostavke: normalna porazdelitev v vsaki skupini; homogenost varianc; odvisne spremenljivke so na intervalnem ali razmernostnem nivoju
Hipoteze: H0: μ1 = μ2
H1: μ1 ≠ μ2 (dvosmerno);
μ1 < μ2 ali μ1 > μ2 (enosmerno)
Alternative: Mann-Whitneyev U-test

Primer:
Če želimo ugotoviti ali se ženske in moški v Sloveniji statistično pomembno razlikujejo v telesni višini, bomo uporabili ta test. Test nam po povedal ali statistično pomembna razlika v telesni višini med moškimi in ženskami obstaja ali ne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Kakšen test uporabimo, ko imamo dva odvisna vzorca? Kakšne hipoteze lahko preverimo? Opiši test in katere predpostavke so potrebne, da ta test lahko uporabimo. Obstajajo kakšni neparametrični ekvivalenti temu testu?

A

Pri t-testu za odvisne vzorce (parnem t-testu) za razliko od testa za neodvisne vzorce primerjamo povprečja odvisnih ali parnih vzorcev. Parni t-test je primerjava istih enot v
dveh različnih časovnih točkah (npr. iste osebe pred in po tretmaju)

Predpostavke: normalna porazdelitev razlik (d); odvisne spremenljivke so na intervalnem ali razmernostnem nivoju
Hipoteze: H0: μd = 0
H1: μd ≠ 0 (dvosmerno);
μd > 0 ali μd < 0 (enosmerno)

Neparametrični ekvivalenti: Wilcoxonov test ekvivalentnih parov
Primer:
da merimo vsebnost klora v vodi zjutraj in zvečer v 100 bazenih. Ko bomo ugotavljali ali se
povprečji vsebnosti klora zjutraj in zvečer med seboj razlikujeta, bomo uporabili parni t-test.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Kakšen test uporabimo, ko imamo več odvisnih oz. neodvisnih vzorcev? Kakšne hipoteze lahko preverimo? Opiši test in katere predpostavke so potrebne, da ta test lahko uporabimo. Obstajajo kakšni neparametrični ekvivalenti temu testu?

A

Pri obeh uporabimo enosmerno analizo ANOVA, preko katere primerjamo več
neodvisnih skupin.
Predpostavke: normalna porazdelitev v vsaki skupini; homogenost varianc
Hipoteze: H0: μ1 = μ2 = … = μk
H1: vsaj en μj različen od ostalih
(s post hoc testi lahko ugotavljamo, med katerimi skupinami so se pojavile skupine)
Neparametrični ekvivalenti: Kruskal-Wallisov Htest; razširjeni medianski test

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Opiši primer t-testa za en vzorec

A

Primer: 53 študentov je neodvisno ocenjevalo trajanje 63 s časovnega intervala. Zastavili smo si raziskovalno vprašanje: »Ali so študenti psihologije nepristranski ocenjevalci?« Zanima nas torej, ali bo povprečna ocena trajanja enaka 63 (sekund). Odločili smo se za dvostranski test, saj nimamo razloga da bi trdili, da bodo ocene previsoke ali prenizke.
Postavimo statistični hipotezi:
H0: μ = 63 (lahko tudi μ - 63 = 0)
H1: μ ≠ 63
Izberemo raven tveganja: α = 0,05
Preverimo porazdelitev. Ni dokazov, da bi porazdelitev podatkov značilno odstopala od normalne. Odločimo se za** t-test.**
Izračunamo opisne statistike in stopinje prostosti:
M = 69,1
SD = 23,9
SEM = 3,28
df = 52
Izračunamo vrednost testne statistike:
t = (69,1 – 63) / 3,28 = 1,86
Vrednost testne statistike primerjamo s t-porazdelitvijo. Izberemo lahko med dvema načinoma interpretacije testne statistike:
a) Poiščemo kritično vrednost pri izbrani ravni tveganja in stopinjah prostosti: tkrit. (52) = 2,01. Vrednost testne statistike (1,86) je manjša od kritične vrednosti. **Ničelne hipoteze ne moremo zavrniti. **
b) Poiščemo p-vrednost, ki ustreza absolutni vrednosti testne statistike in stopinjam prostosti: p = 0,069. P-vrednost je večja od izbrane ravni tveganja. **Ničelne hipoteze ne moremo zavrniti. **
Namesto dvostranskega t testa za en vzorec, pa lahko uporabimo tudi intervalno oceno. Izračunamo 95 % interval zaupanja, ki znaša [62,5; 75,7]. Interval zaupanja vsebuje fiksno vrednost (63), kar pomeni da **ne moremo zavreči H0. **

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Opiši primer t-testa za odvisna vzorca

A

PRIMER:
Na vzorcu 10 učencev smo merili, koliko časa porabijo za obdelavo znanega in koliko za obdelavo neznanega besedila. Zastavili smo raziskovalno vprašanje »Ali poznanost gradiva vpliva na čas obdelave gradiva.« Zanima nas torej, ali se čas za obdelavo znanega besedila značilno razlikuje od časa za obdelavo neznanega besedila (oziroma ali vzorca izhajata iz populacij z enako
aritmetično sredino). Odločili smo se za dvostranski preizkus.
Postavimo statistični hipotezi:
H0: μ1 = μ2
H1: μ1 ≠ μ2
Ničelno hipotezo lahko formuliramo še na drugačen način: μ2 - μ1 = 0. Nova hipoteza trdi, da je povprečje razlik med aritmetičnima sredinama enako 0. Če bi torej izračunali razliko med aritmetičnima sredinama za vsakega udeleženca v vzorcu in nato izračunali povprečje teh razlik, bi se hipoteza glasila: μrazlik = 0. To hipotezo že znamo preveriti s t-testom za en vzorec
Izberemo raven tveganja: α = 0,05.
Izračunamo povprečne razlike za vsakega udeleženca v vzorcu.
Preverimo porazdelitev razlik. Ni dokazov, da bi porazdelitev podatkov značilno odstopala od normalne. Odločimo se za t-test
za odvisne vzorce.
Izračunamo opisne statistike in stopinje prostosti:
Mrazlik = - 13,51; SDrazlik = 13,39
SErazlik = 13,39 / √10 = 4,23
df = 9
Izračunamo vrednost testne statistike:
t = (-13,51 – 0) / 4,23 = -3,19
Vrednost testne statistike primerjamo s t-porazdelitvijo. Izberemo lahko med dvema načinoma interpretacije testne statistike:
a) Poiščemo kritično vrednost pri izbrani ravni tveganja in stopinjah prostosti: tkrit. (9) = 2,26. Vrednost testne statistike (-
3,19) je večja od kritične vrednosti. Ničelno hipotezo zavrnemo in sprejmemo alternativno hipotezo.
b) Poiščemo p-vrednost, ki ustreza absolutni vrednosti testne statistike in preverimo, ali je večja od ravni tveganja.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Opiši Wilcoxonov test ekvivalentnih parov

A

Neparametrični preizkusi ne temeljijo na predpostavkah o določeni obliki porazdelitve, zato jih lahko uporabimo, kadar so kršeni pogoji za parametrični preizkus. Wilcoxonov test** ne zahteva normalne porazdelitve**, še vedno pa zahteva podatke vsaj na intervalnem nivoju in neodvisnost vzorčenja.
Wilcoxonov test ekvivalentnih parov
Pogoji: neodvisnost vzorčenja, vsaj intervalni nivo
Hipoteze:
H0: 𝑀𝑑𝑛1 = 𝑀𝑑𝑛2
oziroma Vzorca sta iz populacij z enakim povprečjem rangov razlik.
H1: 𝑀𝑑𝑛1 ≠ 𝑀𝑑𝑛2
oziroma Vzorca sta iz populacij z različnim povprečjem rangov razlik.
Postopek:
1. Za vsak par izračunamo razliko med prvo in drugo meritvijo.
2. Glede na velikost razlike vsakemu paru določimo rang (večja kot je razlika, višji je rang).
3. Rangom določimo predznake, glede na to, ali je bila razlika pozitivna ali negativna.
4. Izračunamo vsoto vseh pozitivnih rangov (S+) in negativnih rangov (S-).
5. V tabeli ali z računalnikom poiščemo p-vrednost, ki nam pove, ali je razlika večja, kot bi pričakovali po slučaju.

PRIMER:
Na vzorcu 10 učencev smo merili, koliko časa porabijo za obdelavo znanega in koliko za obdelavo neznanega besedila. Zastavili smo raziskovalno vprašanje »Ali poznanost gradiva vpliva na čas obdelave gradiva.« Zanima nas torej, ali se čas za obdelavo znanega besedila značilno razlikuje od časa za obdelavo neznanega besedila. Preverimo porazdelitev podatkov, ki pokaže da razlike med vzorcema niso normalno porazdeljene. Odločimo se za uporabo neparametrične alternative.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Opiši primer t-testa za neodvisna vzorca

A

PRIMER:
Imamo skupino 10 študentov, ki je pisala prvo verzijo izpita, in skupino 10 študentov, ki je pisala drugo verzijo izpita. Zastavili smo raziskovalno vprašanje »Ali se dve obliki izpita razlikujeta po težavnosti.« Zanima nas torej, ali se povprečna uspešnost študentov ene skupine statistično značilno razlikuje od uspešnosti druge skupine študentov (oziroma ali vzorca izhajata iz populacij z enako aritmetično sredino). Odločili smo se za dvostranski preizkus.
Postavimo statistični hipotezi:
H0: μ1 = μ2
H1: μ1 ≠ μ2
Izberemo raven tveganja: α = 0,05.
Izračunamo povprečne razlike za vsakega udeleženca v vzorcu. Preverimo porazdelitev podatkov. Ni dokazov, da bi porazdelitev podatkov značilno odstopala od normalne. Levenov test homogenost pokaže, da so variance homogene. Odločimo se za t-test.
Izračunamo opisne statistike in stopinje prostosti:
M1 = 90,3 ; M2 = 56,0
VAR1 = 838,5 ; VAR2 = 524,4
SE = √(838,5/10 + 524,4/10) = 11,7
df = 10 + 10 – 2 = 18
Izračunamo vrednost testne statistike:
t = (90,4 – 56,0) / 11,7 = 2,95
Vrednost testne statistike primerjamo s t-porazdelitvijo. Izberemo lahko med dvema načinoma interpretacije testne statistike:
a) Poiščemo kritično vrednost pri izbrani ravni tveganja in stopinjah prostosti: tkrit. (18) = 2,101. Vrednost testne statistike
(2,95) je večja od kritične vrednosti. Ničelno hipotezo zavrnemo in sprejmemo alternativno hipotezo.
b) Poiščemo p-vrednost, ki ustreza absolutni vrednosti testne statistike in preverimo, ali je večja od izbrane ravni tveganja.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Kaj je Welchov popravek?

A

Eden od pogojev za uporabo t-testa za neodvisne vzorce je homogenost varianc. Kadar varianci obeh vzorcev nista homogeni (se med seboj srednje močno razlikujeta), uporabimo Welchov popravek za heterogenost skupin. Kadar so razlike v varianci izjemno velike, Welchovega popravka ne moremo uporabiti. Welchov popravek je običajen t-test (vrednost t-statistike ostane enaka) z
nekoliko spremenjenimi prostostnimi stopinjami (posledično nekoliko drugačno p-vrednostjo).
Velikost učinka
Pri poročanju o velikosti učinka lahko izbiramo med dvema merama:
* Cohenov d nam pove, za koliko standardnih odklonov se razlikujeta aritmetični sredini obeh vzorcev
𝑑 =
|𝑀1 − 𝑀2
|
𝑆𝐷𝑣𝑠𝑒ℎ
* koeficient determinacije nam pove, kolikšen odstotek variance lahko pojasnimo z vplivom neodvisne spremenljivke

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Opiši Mann-Whitneyev U test

A

Pri izpolnjenih predpostavkah t-testa ima MW manjšo moč, sicer pa je lahko tudi bistveno večja.
Mann-Whitneyev U test
Pogoji: neodvisnost vzorčenja, vsaj ordinalni nivo
Hipoteze:
H0: 𝑀𝑑𝑛1 = 𝑀𝑑𝑛2
oziroma 𝑃(𝑥1 < 𝑥2
) = 𝑃(𝑥1 > 𝑥2)
H1: 𝑀𝑑𝑛1 ≠ 𝑀𝑑𝑛2
oziroma 𝑃(𝑥1 < 𝑥2
) ≠ 𝑃(𝑥1 > 𝑥2)
Postopek:
1. Vsaki vrednosti določimo rang, ne glede na to, kateremu vzorcu pripada (večje vrednosti dobijo višje range).
2. Range nato grupiramo, glede na to, iz katerega vzorca prihaja rezultat.
3. Za oba vzorca izračunamo vsoto rangov.
4. V tabeli ali z računalnikom poiščemo p-vrednost, ki nam pove, ali je razlika večja, kot bi pričakovali po slučaju.

Primer:
Imamo skupino 10 študentov, ki je pisala prvo verzijo izpita, in skupino 10 študentov, ki je pisala drugo verzijo izpita. Zastavili smo raziskovalno vprašanje »Ali se dve obliki izpita razlikujeta po težavnosti.« Zanima nas torej, ali se povprečna uspešnost študentov ene skupine statistično značilno razlikuje od uspešnosti druge skupine študentov. Preverimo porazdelitev podatkov, ki pokaže da dosežki na testu niso normalno porazdeljeni. Odločimo se za uporabo neparametrične alternative.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Opiši ANOVO- kaj nam pove, kakšne predpogoje morajo izpolnjevati podatki, kdaj jo uporabljamo, kaj so pomanjklivosti, …?

A

Kdaj jo uporabljamo? Ko želimo preveriti, če se tri ali več skupin med seboj statistično pomembno razlikujejo v določeni lastnosti (in so izpolnjeni vsi pogoji)

Pogoji: samo na intervalnih in razmernostnih odvisnih spremenljivkah; podatki in reziduali (nepojasnjeni odkloni) morajo biti normalno porazdeljeni, variance morajo biti homogene; podatki morajo biti vzorčeni neodvisno

Pomankljivosti (na primeru)
Recimo, da nas zanima ali se ljudje iz Ljubljane, Maribora in Kopra med seboj statistično pomembno razlikujejo v povprečni telesni višini. V tem primeru bomo uporabili analizo variance, če bodo seveda za to izpolnjeni vsi pogoji.
ANOVA nam pove ali se tri skupine med seboj razlikujejo ali ne, ne bo pa nam povedala kateri dve skupini sta tisti, ki se razlikujeta. To preverimo s post-hoc testi (npr. f-test primerja variance povprečji med skupinami vzorcev in znotraj vzorcev variance povpreči)

! Obstaja več vrst ANOVE, mi bomo spoznali preizkus one-way ANOVA (zest je dobil ime po one-way klasifikaciji, kjer delimo udeležence v skupine glede na en kriterij / spremenljivko)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Na primeru prikaži uporabo ANOVE

A

Imamo dva vzorca po 9 udeležencev. Zanima nas, ali se statistično značilno razlikujeta po dosežku na testu. Pogoji za uporabo ANOVE so izpolnjeni. (Tokrat bomo izjemoma uporabili analizo variance samo za dva vzorca, sicer jo navadno uporabljamo za več vzorcev).
Najprej izračunamo povprečni dosežek za vse udeležence (Mtot) in povprečni dosežek za vsako skupino. Nato za vsakega udeleženca iz obeh vzorcem izračunamo vse tri odklone: odklon udeleženčevega dosežka od totalnega povprečja, odklon udeleženčevega dosežka od povprečja njegove skupine in odklon povprečja udeleženčeve skupine od totalnega povprečja. Izračunane odklone kvadriramo. Izračunamo stopinje prostosti znotraj razredov in med razredi. Kvadrate odklonov delimo s stopinjami prostosti, da dobimo srednje kvadrate. F-statistiko izračunamo tako, da delimo srednji kvadrat med razredi s srednjim kvadratom znotraj razredov. Vrednost F-statistike primerjamo z F-porazdelitvijo in poiščemo bodisi kritično vrednost bodisi p-vrednost. Interpretiramo in naredimo zaključek.

V našem primeru je vrednost F-statistike (F = 108) veliko večja od kritične vrednosti (Fkrit.(1,16) = 4,49). Zavrnemo H0 in sprejmemo H1 (razliki med vzorcema sta statistično značilni).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Tako velikost učinka kot moč testa odražata delež variance, ki jo pojasnjujemo s faktorjem. Kaj vse vpliva na moč testa?

A

Na moč testa namreč vplivajo:
* velikost vzorca (večji vzorec, večja moč),
* velikost učinka (večje ko so populacijske razlike v M, večja bo moč testa),
* raven tveganja (višja ko je vrednost alfa, večja bo moč testa),
* število skupin ob enakem numerusu (če imamo 100 ljudi razdeljeno v dve skupini po 50 oseb, bo moč testa večja, kot če
jih razdelimo v 10 skupin po 10 oseb).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Kaj je eta kvadrat in kaj nam pove? (ANOVA modeli)

A

Eta meri delež variance povezane z vsakim glavnim efektom in interakcijskim efektom v ANOVA modelu in se uporablja za izračun moči testa.
Eta kvadrat je delež pojasnjene variance v vzorcu (koeficient med vsotama kvadratov); enakovreden koeficientu determinacije; težava: v vzorcih sistematično pristranski (vedno nekoliko višji od deleža pojasnjene variance)
Vrednost eta kvadrata meri od 0 - 1, vrednosti bližji 1 kažejo na višji delež variance. Načeloma sledimo temu:
0.01 -> majhna velikost učinka
0.06 -> srednja velikost učinka
0.14 -> velika velikost učinka

Primer:
Želimo določiti, če intenzivnost vaje in spol vplivata na izgubo teže. Imamo 60 udeležencev (30 žensk). Imamo tri skupine - brez vaje, lahka vadba ali intenzivna vadba (en mesec).
Rezultati two-way ANOVE (mi se sicer samo one-way učimo ampak dobr) [vadba in spol sta faktorja in izguba teže je response variable]
Suppose we want to determine if exercise intensity and gender impact weight loss.

        Df Sum Sq Mean Sq F value p value     gender       1   15.8   15.80   9.916 0.00263 exercise     2  505.6  252.78 158.610 < 2e-16 Residuals   56   89.2    1.59   Če izračunamo SStotal je to 610.6. ETA kvadrat za spol in vadbo potem izračunamo takole: eta kvadrat za spol: 15.8 / 610.6 = .02588 eta kvadrat za vadbo: 505.6 / 610.6 = .828
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Kaj je omega kvadrat in kaj nam pove? (ANOVA modeli)

A

Omega kvadrat je način merjenja velikosti učinka v ANOVA modelih. Je manj pristranski kot eta kvadrat (sploh ob manjših n-jih) ampak se manj uporablja. Omega kvadrat je ocena deleža pojasnjene variance v populaciji in je nepristranska cenilka deleža pojasnjene variance.
ω2 vrednosti so med ± 1. Ničla kaže na to, da efekta ni. Če je F manjši od ena, bo ω2 negativen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Kaj je Cohen’s F statistika?

A

Uporablja se pri analizi moči testa.
Cohen [1] suggested the following interpretation for f when used in ANOVA / ANCOVA:

.10 = Small effect size,
.25 = Medium effect size,
.40 = Large effect size.
When f = 0, that’s an indication that the population means are all equal. As the means get further and further apart, f will grow indefinitely larger.

For f squared, the suggestions are:

.2 = Small effect size,
.15 = Medium effect size,
.35 = Large effect size.

17
Q

Pri ANOVI lahko uporabljamo nadaljne analize, kot apriorni kontrasti in post hoc preizkusi. Opiši in razloži oba pojma.

A

Statistično značilen rezultat analize variance nam pove le, da se statistično značilno razlikujeta M vsaj dveh skupin. Pogosto nas zanima tudi, točno med katerimi skupinami so statistično značilne razlike v M. Potrebna je nadaljnja analiza, ki jo lahko izvedemo na več načinov:
* apriorni kontrasti: vnaprej določimo omejeno število primerjav, ki so smiselne
o uporabimo samo kadar vnaprej predvidimo manjše število primerjav (pri več zaporednih rimerjavah, se veča verjetnost za alfa napako)
o za primerjave uporabimo t-test (korekcije niso potrebne)
o primer: želimo preveriti le, ali se tri eksperimentalne skupine razlikujejo od kontrolne, ne pa tudi ali se razlikujejo med sabo

  • post hoc preizkusi: primerjav ne načrtujemo vnaprej vse skupine primerjamo z vsemi drugimi skupinami
    o tudi tu je v ozadju t-test, le da vključuje korekcije p-vrednosti (izogibanje napaki alfa)
    o poznamo več post hoc preizkusov:
    ▪ Tukeyev HSD (manj strog, večja moč)
    ▪ Schefferjev test
    ▪ Holm-Bonferronijeva prilagoditev (najbolj strog: manj možnosti za napako alfa, vendar majhna moč)
18
Q

Za uporabo ANOVE morajo podatki slediti določenimi pogojem. V primeru, da tem pogojem ne sledijo, si lahko pomagamo na različne načine. Načine opiši

A

Rešitve v primeru kršenja predpostavk
* v primeru nehomogenih varianc in enako velikih skupin je ANOVA dovolj robustna, da lahko izvedemo analizo brez popravkov
*** Welchov popravek **prostostnih stopenj (kadar so skupine različno velike): pri visokem razmerju varianc različnih skupin, pri numerusu vsaj 10 in normalni porazdelitvi
* pretvorba podatkov: asimetrične porazdelitve približamo normalnim, zmanjšamo heterogenost varianc (možne transformacije: arc sin, korenjenje, logaritmiranje, potenciranje); težave pri interpretaciji rezultatov
* neparametrične alternative: Kruskal-Wallisov H test, bootstrap …

19
Q

Opiši Kruskal-Wallisov H test

A

Neparametrična alternativa analizi variance.
Kruskal-Wallisov H test
Pogoji: neodvisnost vzorčenja, vsaj ordinalni nivo
Hipoteze:
H0: 𝑀𝑑𝑛1 = 𝑀𝑑𝑛2
oziroma 𝑃𝑜𝑣𝑝𝑟𝑒č𝑛𝑖 𝑟𝑎𝑛𝑔𝑖 𝑠𝑜 𝑒𝑛𝑎𝑘𝑖.
H1: 𝑀𝑑𝑛1 ≠ 𝑀𝑑𝑛2
oziroma 𝑉𝑠𝑎𝑗 𝑒𝑛 𝑝𝑎𝑟 𝑝𝑜𝑣𝑝𝑟𝑒č𝑛𝑖ℎ 𝑟𝑎𝑛𝑔𝑜𝑣 𝑗𝑒 𝑟𝑎𝑧𝑙𝑖č𝑒𝑛.
Postopek:
1. Vsaki vrednosti določimo rang, ne glede na to, kateremu vzorcu pripada (večje vrednosti dobijo višje range).
2. Range nato grupiramo, glede na to, iz katerega vzorca prihaja rezultat.
3. Za vse vzorca izračunamo vsoto rangov Rj.
4. Izračunamo vrednost testne statistike.
5. Za majhne vzorce poiščemo kritično in/ali p-vrednost v H-tabeli, za večje vzorce pa v Hi-kvadrat tabeli.
6. Za post hoc preizkus uporabimo ustrezno neparametrično alternativo (npr. Mann-Whitney test).
P r e i z k u s i d o m n e v o a r i t m e t i č n i h s r e d i n a h | 45
Testna statistika:
𝐻 =
12
𝑛 ⋅ (𝑛 + 1)
⋅ ∑
𝑅𝑗
2
𝑛𝑗
− 3 ⋅ (𝑛 + 1)

PRIMER:
Tri skupine študentov so pisale izpit. Prvi so ga pisali medtem ko se je predvajala glasba, drugi v tišini in tretji v hrupu. Želimo ugotoviti, ali se skupine statistično značilno razlikujejo po oceni na izpitu.

20
Q

Naštej in opiši druge primere analize variance (Načrti s ponovljenimi meritvami; Večsmerne analize variance, faktorski načrti; Multivariantna analiza variance (MANOVA); Analiza kovariance (ANCOVA); Analiza variance s slučajnimi faktorji)

A

**Načrti s ponovljenimi meritvami: **
Gre za uporabo ANOVE na odvisnih vzorcih. Prednost je večja moč testa, saj lahko bolje kontroliramo medosebne razlike (manjši vpliv razlik, ki bi nastale zaradi individualnih razlik udeležencev med vzorci). Slabost je učinek večja kompleksnost analize (bolj zahteven postopek) in pojav učinkov zaporedja (prvo merjenje udeleženca spremeni, zato na drugem testiranju doseže drugačen rezultat, kot bi ga sicer). Slednjemu se lahko izognemo z menjavanjem vrstnega red pogojev ni enak (npr. del udeležencev najprej rešuje prvi test, del udeležencev pa drugega).

**Večsmerne analize variance, faktorski načrti **
Gre za primere, kjer imamo več kot en faktor, saj preučujemo interakcije, medsebojne učinke med faktorji (npr. kako je učinkovanje zdravila na zmanjšanje bolečine odvisno od starosti). Meritve so lahko neponovljene (neodvisni vzorci), ponovljene (odvisni vzorci) ali pa gre za kombinacijo obeh.
Variabilnost delimo nekoliko drugače, in sicer na glavne učinke, napako in nterakciji (učinek faktorja A odvisen od vrednosti faktorja B).

Multivariantna analiza variance (MANOVA)
Preučujemo več odvisnih spremenljivk (npr. ali imajo zdravila učinek na zmanjšanje bolečine in hkrati ali imajo vpliv na splošno počutje). Faktor je lahko samo en, ali pa jih je več.

Analiza kovariance (ANCOVA)
Kovariat je značilnost, ki jo želimo kontrolirati, saj se skupini razlikujeta glede na raven kovariata, kar lahko vpliva na odvisno spremenljivko. Pred preverjanjem učinka faktorja, skupine izenačimo glede na raven kvantitativnega kovariata (npr. glede na to, ali so v začetni ali napredni stopnji bolezni, ali glede na to, kolikšna je njihova splošna raven bolečine).

Analiza variance s slučajnimi faktorji
Vrednosti faktorja so določene po slučaju, niso določene glede na nek teoretični razmislek. Zanima nas na primer, ali se slovenski učenci razlikujejo po uspešnosti na nekem testu. Šole, na katerih bomo izvajali meritve, izberemo naključno