Preizkusi domnev o artimetičnih sredinah Flashcards
Kakšen test uporabimo, ko imamo en vzorec? Kakšne hipoteze lahko preverimo? Opiši test in katere predpostavke so potrebne, da ta test lahko uporabimo. Obstajajo kakšni neparametrični ekvivalenti temu testu?
T-test za en vzore nam pove ali obstaja statistično značilna razlika med dejanskim povprečjem in hipotetičnim povprečjem, ki ga sami določimo. Ta test je primerjava vzorčne aritmetične sredine z znano populacijsko aritmetično sredino (c)
Predpostavke: normalna porazdelitev, odvisne spremenljivke so na intervalnem ali razmernostnem nivoju
Hipoteze= H0: μ = c; H1: μ ≠ c (dvosmerno); μ > c ali μ < c (enosmerno).
Neparametrični ekvivalenti tega testa ne obstajajo.
Na primer, da računamo t test za en vzorec med povprečjem telesne višine ljudi iz
Maribora in hipotetično telesno višino, ki pa je slovensko povprečje. Ugotovili bomo ali se povprečje telesne višine ljudi iz Maribora statistično pomembno razlikuje od povprečne slovenske telesne višine.
Kakšen test uporabimo, ko imamo dva neodvisna vzorca? Kakšne hipoteze lahko preverimo? Opiši test in katere predpostavke so potrebne, da ta test lahko uporabimo. Obstajajo kakšni neparametrični ekvivalenti temu testu?
**T-test za neodvisne vzorce **nam pove ali se dve neodvisni skupini med seboj v povprečju **statistično značilno razlikujeta. ** Ta test je primerjava med dvema neodvisnima skupinama (različne enote)
Predpostavke: normalna porazdelitev v vsaki skupini; homogenost varianc; odvisne spremenljivke so na intervalnem ali razmernostnem nivoju
Hipoteze: H0: μ1 = μ2
H1: μ1 ≠ μ2 (dvosmerno);
μ1 < μ2 ali μ1 > μ2 (enosmerno)
Alternative: Mann-Whitneyev U-test
Primer:
Če želimo ugotoviti ali se ženske in moški v Sloveniji statistično pomembno razlikujejo v telesni višini, bomo uporabili ta test. Test nam po povedal ali statistično pomembna razlika v telesni višini med moškimi in ženskami obstaja ali ne.
Kakšen test uporabimo, ko imamo dva odvisna vzorca? Kakšne hipoteze lahko preverimo? Opiši test in katere predpostavke so potrebne, da ta test lahko uporabimo. Obstajajo kakšni neparametrični ekvivalenti temu testu?
Pri t-testu za odvisne vzorce (parnem t-testu) za razliko od testa za neodvisne vzorce primerjamo povprečja odvisnih ali parnih vzorcev. Parni t-test je primerjava istih enot v
dveh različnih časovnih točkah (npr. iste osebe pred in po tretmaju)
Predpostavke: normalna porazdelitev razlik (d); odvisne spremenljivke so na intervalnem ali razmernostnem nivoju
Hipoteze: H0: μd = 0
H1: μd ≠ 0 (dvosmerno);
μd > 0 ali μd < 0 (enosmerno)
Neparametrični ekvivalenti: Wilcoxonov test ekvivalentnih parov
Primer:
da merimo vsebnost klora v vodi zjutraj in zvečer v 100 bazenih. Ko bomo ugotavljali ali se
povprečji vsebnosti klora zjutraj in zvečer med seboj razlikujeta, bomo uporabili parni t-test.
Kakšen test uporabimo, ko imamo več odvisnih oz. neodvisnih vzorcev? Kakšne hipoteze lahko preverimo? Opiši test in katere predpostavke so potrebne, da ta test lahko uporabimo. Obstajajo kakšni neparametrični ekvivalenti temu testu?
Pri obeh uporabimo enosmerno analizo ANOVA, preko katere primerjamo več
neodvisnih skupin.
Predpostavke: normalna porazdelitev v vsaki skupini; homogenost varianc
Hipoteze: H0: μ1 = μ2 = … = μk
H1: vsaj en μj različen od ostalih
(s post hoc testi lahko ugotavljamo, med katerimi skupinami so se pojavile skupine)
Neparametrični ekvivalenti: Kruskal-Wallisov Htest; razširjeni medianski test
Opiši primer t-testa za en vzorec
Primer: 53 študentov je neodvisno ocenjevalo trajanje 63 s časovnega intervala. Zastavili smo si raziskovalno vprašanje: »Ali so študenti psihologije nepristranski ocenjevalci?« Zanima nas torej, ali bo povprečna ocena trajanja enaka 63 (sekund). Odločili smo se za dvostranski test, saj nimamo razloga da bi trdili, da bodo ocene previsoke ali prenizke.
Postavimo statistični hipotezi:
H0: μ = 63 (lahko tudi μ - 63 = 0)
H1: μ ≠ 63
Izberemo raven tveganja: α = 0,05
Preverimo porazdelitev. Ni dokazov, da bi porazdelitev podatkov značilno odstopala od normalne. Odločimo se za** t-test.**
Izračunamo opisne statistike in stopinje prostosti:
M = 69,1
SD = 23,9
SEM = 3,28
df = 52
Izračunamo vrednost testne statistike:
t = (69,1 – 63) / 3,28 = 1,86
Vrednost testne statistike primerjamo s t-porazdelitvijo. Izberemo lahko med dvema načinoma interpretacije testne statistike:
a) Poiščemo kritično vrednost pri izbrani ravni tveganja in stopinjah prostosti: tkrit. (52) = 2,01. Vrednost testne statistike (1,86) je manjša od kritične vrednosti. **Ničelne hipoteze ne moremo zavrniti. **
b) Poiščemo p-vrednost, ki ustreza absolutni vrednosti testne statistike in stopinjam prostosti: p = 0,069. P-vrednost je večja od izbrane ravni tveganja. **Ničelne hipoteze ne moremo zavrniti. **
Namesto dvostranskega t testa za en vzorec, pa lahko uporabimo tudi intervalno oceno. Izračunamo 95 % interval zaupanja, ki znaša [62,5; 75,7]. Interval zaupanja vsebuje fiksno vrednost (63), kar pomeni da **ne moremo zavreči H0. **
Opiši primer t-testa za odvisna vzorca
PRIMER:
Na vzorcu 10 učencev smo merili, koliko časa porabijo za obdelavo znanega in koliko za obdelavo neznanega besedila. Zastavili smo raziskovalno vprašanje »Ali poznanost gradiva vpliva na čas obdelave gradiva.« Zanima nas torej, ali se čas za obdelavo znanega besedila značilno razlikuje od časa za obdelavo neznanega besedila (oziroma ali vzorca izhajata iz populacij z enako
aritmetično sredino). Odločili smo se za dvostranski preizkus.
Postavimo statistični hipotezi:
H0: μ1 = μ2
H1: μ1 ≠ μ2
Ničelno hipotezo lahko formuliramo še na drugačen način: μ2 - μ1 = 0. Nova hipoteza trdi, da je povprečje razlik med aritmetičnima sredinama enako 0. Če bi torej izračunali razliko med aritmetičnima sredinama za vsakega udeleženca v vzorcu in nato izračunali povprečje teh razlik, bi se hipoteza glasila: μrazlik = 0. To hipotezo že znamo preveriti s t-testom za en vzorec
Izberemo raven tveganja: α = 0,05.
Izračunamo povprečne razlike za vsakega udeleženca v vzorcu.
Preverimo porazdelitev razlik. Ni dokazov, da bi porazdelitev podatkov značilno odstopala od normalne. Odločimo se za t-test
za odvisne vzorce.
Izračunamo opisne statistike in stopinje prostosti:
Mrazlik = - 13,51; SDrazlik = 13,39
SErazlik = 13,39 / √10 = 4,23
df = 9
Izračunamo vrednost testne statistike:
t = (-13,51 – 0) / 4,23 = -3,19
Vrednost testne statistike primerjamo s t-porazdelitvijo. Izberemo lahko med dvema načinoma interpretacije testne statistike:
a) Poiščemo kritično vrednost pri izbrani ravni tveganja in stopinjah prostosti: tkrit. (9) = 2,26. Vrednost testne statistike (-
3,19) je večja od kritične vrednosti. Ničelno hipotezo zavrnemo in sprejmemo alternativno hipotezo.
b) Poiščemo p-vrednost, ki ustreza absolutni vrednosti testne statistike in preverimo, ali je večja od ravni tveganja.
Opiši Wilcoxonov test ekvivalentnih parov
Neparametrični preizkusi ne temeljijo na predpostavkah o določeni obliki porazdelitve, zato jih lahko uporabimo, kadar so kršeni pogoji za parametrični preizkus. Wilcoxonov test** ne zahteva normalne porazdelitve**, še vedno pa zahteva podatke vsaj na intervalnem nivoju in neodvisnost vzorčenja.
Wilcoxonov test ekvivalentnih parov
Pogoji: neodvisnost vzorčenja, vsaj intervalni nivo
Hipoteze:
H0: 𝑀𝑑𝑛1 = 𝑀𝑑𝑛2
oziroma Vzorca sta iz populacij z enakim povprečjem rangov razlik.
H1: 𝑀𝑑𝑛1 ≠ 𝑀𝑑𝑛2
oziroma Vzorca sta iz populacij z različnim povprečjem rangov razlik.
Postopek:
1. Za vsak par izračunamo razliko med prvo in drugo meritvijo.
2. Glede na velikost razlike vsakemu paru določimo rang (večja kot je razlika, višji je rang).
3. Rangom določimo predznake, glede na to, ali je bila razlika pozitivna ali negativna.
4. Izračunamo vsoto vseh pozitivnih rangov (S+) in negativnih rangov (S-).
5. V tabeli ali z računalnikom poiščemo p-vrednost, ki nam pove, ali je razlika večja, kot bi pričakovali po slučaju.
PRIMER:
Na vzorcu 10 učencev smo merili, koliko časa porabijo za obdelavo znanega in koliko za obdelavo neznanega besedila. Zastavili smo raziskovalno vprašanje »Ali poznanost gradiva vpliva na čas obdelave gradiva.« Zanima nas torej, ali se čas za obdelavo znanega besedila značilno razlikuje od časa za obdelavo neznanega besedila. Preverimo porazdelitev podatkov, ki pokaže da razlike med vzorcema niso normalno porazdeljene. Odločimo se za uporabo neparametrične alternative.
Opiši primer t-testa za neodvisna vzorca
PRIMER:
Imamo skupino 10 študentov, ki je pisala prvo verzijo izpita, in skupino 10 študentov, ki je pisala drugo verzijo izpita. Zastavili smo raziskovalno vprašanje »Ali se dve obliki izpita razlikujeta po težavnosti.« Zanima nas torej, ali se povprečna uspešnost študentov ene skupine statistično značilno razlikuje od uspešnosti druge skupine študentov (oziroma ali vzorca izhajata iz populacij z enako aritmetično sredino). Odločili smo se za dvostranski preizkus.
Postavimo statistični hipotezi:
H0: μ1 = μ2
H1: μ1 ≠ μ2
Izberemo raven tveganja: α = 0,05.
Izračunamo povprečne razlike za vsakega udeleženca v vzorcu. Preverimo porazdelitev podatkov. Ni dokazov, da bi porazdelitev podatkov značilno odstopala od normalne. Levenov test homogenost pokaže, da so variance homogene. Odločimo se za t-test.
Izračunamo opisne statistike in stopinje prostosti:
M1 = 90,3 ; M2 = 56,0
VAR1 = 838,5 ; VAR2 = 524,4
SE = √(838,5/10 + 524,4/10) = 11,7
df = 10 + 10 – 2 = 18
Izračunamo vrednost testne statistike:
t = (90,4 – 56,0) / 11,7 = 2,95
Vrednost testne statistike primerjamo s t-porazdelitvijo. Izberemo lahko med dvema načinoma interpretacije testne statistike:
a) Poiščemo kritično vrednost pri izbrani ravni tveganja in stopinjah prostosti: tkrit. (18) = 2,101. Vrednost testne statistike
(2,95) je večja od kritične vrednosti. Ničelno hipotezo zavrnemo in sprejmemo alternativno hipotezo.
b) Poiščemo p-vrednost, ki ustreza absolutni vrednosti testne statistike in preverimo, ali je večja od izbrane ravni tveganja.
Kaj je Welchov popravek?
Eden od pogojev za uporabo t-testa za neodvisne vzorce je homogenost varianc. Kadar varianci obeh vzorcev nista homogeni (se med seboj srednje močno razlikujeta), uporabimo Welchov popravek za heterogenost skupin. Kadar so razlike v varianci izjemno velike, Welchovega popravka ne moremo uporabiti. Welchov popravek je običajen t-test (vrednost t-statistike ostane enaka) z
nekoliko spremenjenimi prostostnimi stopinjami (posledično nekoliko drugačno p-vrednostjo).
Velikost učinka
Pri poročanju o velikosti učinka lahko izbiramo med dvema merama:
* Cohenov d nam pove, za koliko standardnih odklonov se razlikujeta aritmetični sredini obeh vzorcev
𝑑 =
|𝑀1 − 𝑀2
|
𝑆𝐷𝑣𝑠𝑒ℎ
* koeficient determinacije nam pove, kolikšen odstotek variance lahko pojasnimo z vplivom neodvisne spremenljivke
Opiši Mann-Whitneyev U test
Pri izpolnjenih predpostavkah t-testa ima MW manjšo moč, sicer pa je lahko tudi bistveno večja.
Mann-Whitneyev U test
Pogoji: neodvisnost vzorčenja, vsaj ordinalni nivo
Hipoteze:
H0: 𝑀𝑑𝑛1 = 𝑀𝑑𝑛2
oziroma 𝑃(𝑥1 < 𝑥2
) = 𝑃(𝑥1 > 𝑥2)
H1: 𝑀𝑑𝑛1 ≠ 𝑀𝑑𝑛2
oziroma 𝑃(𝑥1 < 𝑥2
) ≠ 𝑃(𝑥1 > 𝑥2)
Postopek:
1. Vsaki vrednosti določimo rang, ne glede na to, kateremu vzorcu pripada (večje vrednosti dobijo višje range).
2. Range nato grupiramo, glede na to, iz katerega vzorca prihaja rezultat.
3. Za oba vzorca izračunamo vsoto rangov.
4. V tabeli ali z računalnikom poiščemo p-vrednost, ki nam pove, ali je razlika večja, kot bi pričakovali po slučaju.
Primer:
Imamo skupino 10 študentov, ki je pisala prvo verzijo izpita, in skupino 10 študentov, ki je pisala drugo verzijo izpita. Zastavili smo raziskovalno vprašanje »Ali se dve obliki izpita razlikujeta po težavnosti.« Zanima nas torej, ali se povprečna uspešnost študentov ene skupine statistično značilno razlikuje od uspešnosti druge skupine študentov. Preverimo porazdelitev podatkov, ki pokaže da dosežki na testu niso normalno porazdeljeni. Odločimo se za uporabo neparametrične alternative.
Opiši ANOVO- kaj nam pove, kakšne predpogoje morajo izpolnjevati podatki, kdaj jo uporabljamo, kaj so pomanjklivosti, …?
Kdaj jo uporabljamo? Ko želimo preveriti, če se tri ali več skupin med seboj statistično pomembno razlikujejo v določeni lastnosti (in so izpolnjeni vsi pogoji)
Pogoji: samo na intervalnih in razmernostnih odvisnih spremenljivkah; podatki in reziduali (nepojasnjeni odkloni) morajo biti normalno porazdeljeni, variance morajo biti homogene; podatki morajo biti vzorčeni neodvisno
Pomankljivosti (na primeru)
Recimo, da nas zanima ali se ljudje iz Ljubljane, Maribora in Kopra med seboj statistično pomembno razlikujejo v povprečni telesni višini. V tem primeru bomo uporabili analizo variance, če bodo seveda za to izpolnjeni vsi pogoji.
ANOVA nam pove ali se tri skupine med seboj razlikujejo ali ne, ne bo pa nam povedala kateri dve skupini sta tisti, ki se razlikujeta. To preverimo s post-hoc testi (npr. f-test primerja variance povprečji med skupinami vzorcev in znotraj vzorcev variance povpreči)
! Obstaja več vrst ANOVE, mi bomo spoznali preizkus one-way ANOVA (zest je dobil ime po one-way klasifikaciji, kjer delimo udeležence v skupine glede na en kriterij / spremenljivko)
Na primeru prikaži uporabo ANOVE
Imamo dva vzorca po 9 udeležencev. Zanima nas, ali se statistično značilno razlikujeta po dosežku na testu. Pogoji za uporabo ANOVE so izpolnjeni. (Tokrat bomo izjemoma uporabili analizo variance samo za dva vzorca, sicer jo navadno uporabljamo za več vzorcev).
Najprej izračunamo povprečni dosežek za vse udeležence (Mtot) in povprečni dosežek za vsako skupino. Nato za vsakega udeleženca iz obeh vzorcem izračunamo vse tri odklone: odklon udeleženčevega dosežka od totalnega povprečja, odklon udeleženčevega dosežka od povprečja njegove skupine in odklon povprečja udeleženčeve skupine od totalnega povprečja. Izračunane odklone kvadriramo. Izračunamo stopinje prostosti znotraj razredov in med razredi. Kvadrate odklonov delimo s stopinjami prostosti, da dobimo srednje kvadrate. F-statistiko izračunamo tako, da delimo srednji kvadrat med razredi s srednjim kvadratom znotraj razredov. Vrednost F-statistike primerjamo z F-porazdelitvijo in poiščemo bodisi kritično vrednost bodisi p-vrednost. Interpretiramo in naredimo zaključek.
V našem primeru je vrednost F-statistike (F = 108) veliko večja od kritične vrednosti (Fkrit.(1,16) = 4,49). Zavrnemo H0 in sprejmemo H1 (razliki med vzorcema sta statistično značilni).
Tako velikost učinka kot moč testa odražata delež variance, ki jo pojasnjujemo s faktorjem. Kaj vse vpliva na moč testa?
Na moč testa namreč vplivajo:
* velikost vzorca (večji vzorec, večja moč),
* velikost učinka (večje ko so populacijske razlike v M, večja bo moč testa),
* raven tveganja (višja ko je vrednost alfa, večja bo moč testa),
* število skupin ob enakem numerusu (če imamo 100 ljudi razdeljeno v dve skupini po 50 oseb, bo moč testa večja, kot če
jih razdelimo v 10 skupin po 10 oseb).
Kaj je eta kvadrat in kaj nam pove? (ANOVA modeli)
Eta meri delež variance povezane z vsakim glavnim efektom in interakcijskim efektom v ANOVA modelu in se uporablja za izračun moči testa.
Eta kvadrat je delež pojasnjene variance v vzorcu (koeficient med vsotama kvadratov); enakovreden koeficientu determinacije; težava: v vzorcih sistematično pristranski (vedno nekoliko višji od deleža pojasnjene variance)
Vrednost eta kvadrata meri od 0 - 1, vrednosti bližji 1 kažejo na višji delež variance. Načeloma sledimo temu:
0.01 -> majhna velikost učinka
0.06 -> srednja velikost učinka
0.14 -> velika velikost učinka
Primer:
Želimo določiti, če intenzivnost vaje in spol vplivata na izgubo teže. Imamo 60 udeležencev (30 žensk). Imamo tri skupine - brez vaje, lahka vadba ali intenzivna vadba (en mesec).
Rezultati two-way ANOVE (mi se sicer samo one-way učimo ampak dobr) [vadba in spol sta faktorja in izguba teže je response variable]
Suppose we want to determine if exercise intensity and gender impact weight loss.
Df Sum Sq Mean Sq F value p value gender 1 15.8 15.80 9.916 0.00263 exercise 2 505.6 252.78 158.610 < 2e-16 Residuals 56 89.2 1.59 Če izračunamo SStotal je to 610.6. ETA kvadrat za spol in vadbo potem izračunamo takole: eta kvadrat za spol: 15.8 / 610.6 = .02588 eta kvadrat za vadbo: 505.6 / 610.6 = .828
Kaj je omega kvadrat in kaj nam pove? (ANOVA modeli)
Omega kvadrat je način merjenja velikosti učinka v ANOVA modelih. Je manj pristranski kot eta kvadrat (sploh ob manjših n-jih) ampak se manj uporablja. Omega kvadrat je ocena deleža pojasnjene variance v populaciji in je nepristranska cenilka deleža pojasnjene variance.
ω2 vrednosti so med ± 1. Ničla kaže na to, da efekta ni. Če je F manjši od ena, bo ω2 negativen.