Statistika Flashcards
Distribucija F-omjera kao i distribucija t-omjera su simetrične distribucije.
N
Ukoliko se aritmetičke sredine između nekih skupina podataka zaista razlikuju, omjer varijance unutar grupa i između grupa trebao bi biti oko 1 nakon izračuna jednostavne analize varijance.
N
Statistička snaga jest vjerojatnost odbacivanja točne nul-hipoteze.
N (prihvaćanje/netočne)
Načelno vrijedi, što je veći hi-kvadrat test to ima veću šansu da bude proglašen statistički značajnim.
T
Opravdano je računati aritmetičku sredinu i standardnu devijaciju ako imamo veliki N (N>1000) a podatke na nominalnoj ljestvici/skali.
N
Podaci za računanje Wilcoxonovog testa ekvivalentnih parova nalaze se na ordinalnoj skali.
N (na intervalnoj ili omjernoj)
….statistička značajna razlika…. čak i kada je povezanost mala npr r=0.34. (nedovršeno pitanje)
T
U nekim je slučajevima opravdano računati i hi kvadrat (kao neparamaterisjki postupak) i t test (kao parametrijski postupak).
T
Što su točke na dijagramu raspršenja bliže jedna drugoj, to znači da je:
a) korelacija među varijablama viša
b) korelacija među varijablama manja
c) pogreška prognoze manja
d) nema utjecaj na korelaciju
a) i c)
Za koeficijent parcijalne korelacije ne vrijedi:
a) ss=N-3
b) znacajnost se testira t-testom
c) ne može biti negativna vrijednost
d) pretpostavlja linearnu povezanost između
sve tri varijable
e) ništa od navedenog
d)
Nul-hipoteza bit će točna za slučaj da je varijanca unutar grupa:
a) veća od varijance između grupa
b) manja od varijance između grupa
c) jednaka varijanci između grupa
d) sve od navedenog.
a) i c)
Nije opravdano računati Spearmana kada:
a. je jedna asimetrična distribucija
b. je raspon rezultata ograničen
c. kada nije linearna povezanost među varijablama
d. ništa od navedenog
e. sve od navedenog
d)
Varijabla čiju vrijednost predviđamo na temelju pravca regresije nazivamo…
kriterijska
Kojim statističkim postupkom provjeravamo je li distribucija normalna?
Hi kvadrat.
Generalno, možemo reći da distribucije stupnjeva slobode za hi-kvadrat test imaju oblik…
hint: … distribucije
pozitivno asimetrične distribucije
Ukoliko je odnos između dvije varijable zakrivljen računamo…
eta koeficijent korelacije
Slaganje između više vezanih rangova računamo…
hint: koeficijentom
koeficijentom konkordancije (W)
Ako je nul hipoteza TOČNA (tj. ne postoji razlike među rezultatima različitih skupina ispitanika), odnos varijabiliteta unutar i između grupa jednak je približno 1.
T
Generalno, možemo reći da distribucije stupnjeva slobode za hi-kvadrat test imaju oblik…
pozitivno asimetrične distribucije
Temeljna pretpostavka generalnog linearnog modela jest da su njegove komponente međusobno nezavisne.
T
Razlika između t-testa i Schefféovog postupka u tome je što se kod t-testa u nazivniku koristi pogreška razlike između aritmetičkih sredina, a kod Schefféovog postupka u nazivniku se nalazi prosječni kvadrat koji pokazuje variranje između svih grupa ispitanika.
T (t-test koristi standardnu pogrešku razlike između aritmetičkih sredina u nazivniku, dok Schefféov postupak koristi prosječni kvadrat greške koji pokazuje variranje između svih grupa ispitanika)
Kada testiramo da li se neka distribucija rezultata razlikuje od kvadratične distribucije to radimo pomoću x^2 testa.
T
Da li se neka distribucija rezultata razlikuje od kvadratične distribucije možemo provjeriti pomoću…
hi-kvadrat testom
Kako raste broj asimetričkih sredina između kojih testiramo značajnost razlike, tako linearno raste i vjerojatnost pogreške tipa I., prema formuli 1- (1-α) n.
T
Pri određivanju zbrojeva kvadrata kod jednostavne analize varijance, računanje totalnog (ukupnog) zbroja kvadrata služi za preciznije formiranje F-omjera.
N (F-test se formira pomoću zbroja kvadrata između i zbroja kvadrata unutar grupa)
U iznimnim slučajevima, ukoliko je N>1000, x^2 test je opravdano računati na proporcijama.
N
Ista vrijednost F-omjera vjerojatnije će biti značajna za stupnjeve slobode ss=3,4, nego za ss=4,3.
T
Kod računanja jednostavne analize varijance za tri skupine podataka alternativna hipoteza može glasiti µ1≠ µ2≠µ3.
N (alternativna hipoteza ne specificira da su sve sredine različite jedna od druge (što bi značilo 𝜇1≠𝜇2≠𝜇3), već samo da postoji barem jedna razlika između grupnih sredina)
Ukoliko imamo N=30 sudionika, podijeljenih u tri skupine, broj stupnjeva slobode grupa je 3.
N (broj grupa - 1 = 3 - 1 = 2)
Varijabilitet između grupa, koji računamo u analizi varijance, posljedica je djelovanja varijable α (nezavisne varijable).
T
Varijanca UNUTAR grupa pod utjecajem je nesistematskih varijabilnih faktora.
T
Kod računanja složene analize varijance izvor varijabilteta unutar grupa jednak je sumi varijabiliteta nastalog djelovanjem glavnog faktora i pogreške.
N (varijabilitet unutar grupa je isključivo varijabilnost koja nije objašnjena efektima glavnih faktora ili njihovim interakcijama, tj. to je pogreška (rezidualna varijabilnost))
Interakcija se pojavljuje kad kombinirano djelovanje dvaju ili više nezavisnih varijabli ima poseban učinak koji se ne može predvidjeti iz poznavanja učinka svake od nezavisnih varijabli za sebe.
T
Ukoliko se aritmetičke sredine između nekih skupina podataka zaista razlikuju, omjer varijance između grupa i unutar trebao bi biti oko 1 nakon izračuna jednostavne analize varijance.
N
Korištenje Yatesove korekcije gubi smisao ukoliko…
su razlike između opaženih i očekivanih frekvencija toliko male (<0.25) da bi njihovo smanjenje za 0.5 rezultiralo većim brojem
Kada računamo jednostavnu analizu varijance na ZAVISNIM podacima, zanima nas omjer varijance unutar sudionika i varijance između sudionika.
N
Pri određivanju zbrojeva kod jednostavne analize varijance, računanje totalnog (ukupnog) zbroja kvadrata služi za preciznije formiranje F-omjera.
N (ukupni zbroj kvadrata se koristi za ukupnu procjenu varijabilnosti podataka, ali ne služi direktno za formiranje F-omjera)
Kad se na istim ispitanicima provode mjerenja zavisne varijable u različitim eksperimentalnim situacijama onda svaki ispitanik služi kao kontrola svakom drugom ispitaniku.
N
Računajući jednostavnu analizu varijance na NEZAVISNIM podacima želimo saznati omjer varijance između sudionika i varijance unutar sudionika.
T
Vrijednost hi kvadrat testa NE može biti negativnog predznaka.
T
Hoće li neka (ista) vrijednost x^2 biti značajna ili ne ovisi o broju opažanja kojima baratamo.
T
Kada testiramo da li se neka distribucija rezultata razlikuje od normalne distribucije, jedan od uvjeta koji mora biti zadovoljen je to da opažene frekvencije u svakoj ćeliji ne smiju biti manje od 5.
N (teoretske/očekivane)
Za F-distribuciju vrijedi da je negativno asimetrična.
N (pozitivno)
Kako nazivamo tablicu koja nam služi kao osnova za izračunavanje hi-kvadrat testa?
Kontingencijska tablica.
Ukoliko nakon završenog računa analize varijance ostanemo pri Ho, NIJE opravdano vršiti pos-hoc analize.
T
Kada je neki F-omjer značajan uz nivo rizika od 1% to sigurno znači da je značajan i uz rizik od 5%.
T
Načelno, distribucija F-omjera kao i distribucija t-omjera, je simetrična distribucija.
N
Distribucija F-omjera, kao i distribucija t-omjera, je normalna distribucija.
N
Ako su razlike između opaženih i očekivanih frekvencija vrlo male tako da primjenom Yatesove korekcije dobijemo razliku koja je numerički veća (bez obzira na predznak), onda upotreba te korekcije nema opravdanja.
T
Nul-hipoteza bit će točna za slučaj da je varijanca unutar grupa jednaka varijanci između grupa.
T
Kod računanja hi-kvadrat testa, broj opaženih i teorijskih frekvencija mora biti jednak.
T
Kada se koristi Yatesova korekcija?
Kada postoji samo 1 stupanj slobode.
Ako je dobiveni F-omjer < 1, ne možemo reći da su razlike u zavisnoj varijabli među skupinama najvjerojatnije posljedica slučaja.
N
Kada imamo N=48 sudionika, podijeljenih u tri skupine, broj stupnjeva slobode između grupa je 3.
N (g - 1)
Distribucija x^2 vrijednosti, načelno je pozitivno asimetrična.
T
Kod analize varijance za nezavisne podatke F-omjer predstavlja omjer prosječne sume kvadrata između grupa i prosječne sume kvadrata unutar grupa.
T
Jedan od najčešće korištenih pred-testova kod jednostavne analize varijance za nezavisne podatke je Schefféov test.
N
Ukoliko varijabilitet između grupa pada dok varijabilitet unutar grupa raste posljedica će biti porast F-omjera.
N
Ako imamo N=30 sudionika, podijeljenih u tri skupine, broj stupnjeva slobode između grupa je 2.
T
Ukoliko varijabilitet između grupa raste dok varijabilitet unutar grupa opada posljedica će biti porast F-omjera.
T
Ako pri nekom testiranju razlike između različitih skupina odbacimo nul-hipotezu to znači da u različitim skupinama ne postoje jednaki pojedinačni rezultati.
N
Distribucija x^2 vrijednosti, načelno ima oblik negativno asimetrične distribucije.
N (pozitivno)
Ako je nul-hipoteza NETOČNA (tj. postoji razlika između različitih skupina), odnos varijabiliteta između grupa i unutar grupa je oko 1.
N
Kod računanja hi-kvadrat testa, broj opaženih i teorijskih frekvencija ne mora nužno biti jednak.
N
F-omjer ne mora uvijek biti pozitivna vrijednost.
N
Za F-distribuciju vrijedi da nema negativnih vrijednosti.
T
Načelno vrijedi, što je manji hi-kvadrat test to ima veću šansu da bude proglašen statistički značajnim.
N
Značajan F-omjer možemo dobiti samo ako je istraživačka hipoteza stvarno točna, a nul-hipoteza netočna.
N
U društvenim znanostima neuobičajeno je da povezanost dvije varijable bude potpuna ili jako visoka (>0.99).
T
Grupiranje rezultata u razrede utječe na veličinu Pearsonovog koeficijenta korelacije tako da ga SMANJUJE.
N
Jednadžba pravca može poslužiti za predviđanje rezultata u Y-varijabli na temelju poznavanja rezultata u X-varijabli samo ako je povezanost između X i Y varijable linearna.
T
Vrijednost H (dobivena nakon izračuna Kruskal-Walisovog testa) uvijek se interpretira na temelju tablice x^2 kvadrat vrijednosti.
N (??? - nisam sigurna za “uvijek”, ali mi ga interpretiramo na temelju te tablice)
Ukoliko utvrdimo da je povezanost između varijable x i y r=0.5, a nakon toga sve vrijednosti u obje varijable pomnožimo s istom konstantom (npr. 2), ponovno izračunata povezanost ostat će r=0.5.
T
Koeficijent determinacije je mjera koja dodatno može pojasniti dobivenu korelaciju.
T
Krivulja koja spaja točke s koordinatama koje su određene parcijalnim srednjim vrijednostima u jednoj varijabli i fiksnim vrijednostima u drugoj varijabli naziva se…
pravac/crta regresije.
Što je povezanost između dvije varijable manja, to je indeks efikasnosti prognoze…
manji
Značajnost koeficijenta multiple korelacije se određuje uz pomoć F-omjera.
T
Ne postoji ni jedan koeficijent korelacije kojim bi se mogla opisati povezanost između dvije varijable koje su u zakrivljenom odnosu.
N (eta koeficijent korelacije)
Što je povezanost između dvije varijable manja, to je veća standardna pogreška prognoze.
T
Pearsonov r se u suštini temelji na t-vrijednostima.
N (računa se kao omjer kovarijacije i standardnih devijacija varijabli)
Ukoliko između dvije varijable ne postoji korelacija, prilikom regresijske analize predviđeni (najvjerojatniji) Y će biti aritmetička sredina kriterijske varijable.
T
Ukoliko testiramo povezanost između dvije varijable, testiramo sljedeću nul-hipotezu: H0: r=1.
N (r = 0)
Kada je koeficijent korelacije negativnog predznaka onda je i koeficijent determinacije negativnog predznaka.
N (formula r^2 * 100)
Ukoliko smo dobili da je Pearsonov r=0.04, a nismo nacrtali dijagram raspršenja, možemo sa sigurnošću reći da ne postoji povezanost između neke dvije varijable.
N (??? - tehnički se vidi da je povezanost jako mala, ali ništa ne možemo reći sa sigurnošću)
Varijabla čiju vrijednost predviđamo na temelju pravca naziva se prediktorskom.
N (kriterijska; prediktorska je varijabla na temelju koje se predviđa rezultat u y varijabli)
Karakteristika koeficijenta konkordancije (W) je to da ne može biti negativnog predznaka.
T
Ukoliko između bilo koje dvije varijable dobijemo statistički značajnu korelaciju koja iznosi r=0,75, možemo sa sigurnošću reći da smo dobili visoku razinu povezanosti.
N
U rijetkim slučajevima Pearsonov r može biti veći od 1.
N
Pearsonov r se u suštini temelji na z-vrijednostima.
T
Ukoliko imamo N<15, a podaci su izraženi na omjernoj ljestvici opravdano je koristiti Pearsonov koeficijent korelacije.
N
Linearni porast vrijednosti koeficijenta determinacije u funkciji je linearnog rasta koeficijenta korelacije na temelju kojeg se računa.
N (???)
Za neparametrijske testove karakteristično je da u svim slučajevima imaju manju snagu od parametrijskih testova.
N (ne UVIJEK, Friedmanov ima istu snagu ko i ANOVA za zavisne, Petz kaže „gotovo jednaku“ ergo kockamo se s N-om)
Grupiranje rezultata u razrede utječe na veličinu Pearsonovog koeficijenta korelacije tako da ga smanjuje.
N
Ako medijan testom utvrdimo razliku između dvije grupe rezultata, tu razliku ćemo pronaći i upotrebom rang testa.
T
Za test predznaka vrijedi da ostajemo pri nul-hipotezi ukoliko je broj promjena u jednom (povećanje rezultata) i drugom (smanjenje rezultata) smjeru podjednak.
T
Ukoliko su podaci izraženi na intervalnoj ili omjernoj ljestvici nije dopušteno koristiti neparametrijske metode.
N
Za test predznaka vrijedi da ima veću snagu od Wilcoxonovog testa ekvivalentnih parova.
N (test predznaka ima najnižu snagu)
Ukoliko određenoj fiksnoj vrijednosti u X-varijabli odgovara samo jedna fiksna vrijednost u Y-varijabli o kakvoj povezanosti govorimo?
Maksimalnoj.
Značajnost koeficijenta multiple korelacije se određuje uz pomoć t-omjera.
N
Ukoliko imamo jednu nominalnu i jednu intervalnu varijablu koje sve koeficijente korelacije smijemo računati?
Point-biserijalni koeficijent korelacije (i možda Pearsonov?)
Grupiranje rezultata u razrede utječe na veličinu Pearsonovog koeficijenta korelacije tako da ga POVEĆAVA.
T
Neparametrijske testove nazivamo „testovi slobodni od normalne distribucije“.
T
Što je povezanost između dvije varijable manja to je koeficijent rezidualnog varijabiliteta…
veći
Značajnost Kendallovog Tau koeficijenta određuje se preko z-vrijednost.
T
Za neparametrijske testove karakteristično je da ih možemo koristiti i kada rezultati nisu normalno distribuirani.
T
Za Test predznaka vrijedi što je manji broj „manjih promjena“ veća je vjerojatnost da je razlika između dvije situacije statistički značajna.
T
Podatke koji su izraženi na ordinalnoj skali nije opravdano zbrajati, oduzimati i računati njihovu prosječnu vrijednost.
T
Neparametrijske testove nazivamo „testovi slobodni od distribucije“.
N (“normalne”)
Pri računanju testa predznaka, sudionici kod kojih u drugom mjerenju nije došlo do promjene, izbacuju se iz daljnje obrade.
T
O čemu treba voditi računa kada odlučujemo koji koeficijent korelacije koristiti za specifičnu skupinu podataka?
Na kojoj su ljestvici izraženi rezultati i je li odnos između varijabli linearan.
Jedino ako je Pearsonov koeficijent korelacije viši od 0.99 i značajan uz nivo rizika 1% (p<0.01) možemo govoriti o uzročno posljedičnoj vezi među dvjema ispitivanim varijablama.
N (kod korelacije ne postoji uročno-posljedična veza)
Korekciju kod Kruskal-Walisovog testa koristimo kada imamo više od 20% vezanih rangova.
N (ali se koristi drugačiji postupak ako je N<10)
Pogreška prognoze je po svojoj prirodi standardna devijacija.
T
Ukoliko kod mjerenih rezultata (intervalna ljestvica) postoji neki iznimno ekstreman rezultat, trebalo bi umjesto Pearsonovog koeficijenta korelacije računati Rang koeficijent korelacije.
T
Snaga testa ovisi o veličini uzorka.
N
Budući da se račun temelji na hi-kvadrat testu određenom tablicom 2X2, prilikom računanja Fi koeficijenta korelacije potrebno je računati Yaetsovu korekciju.
N
Ako je koeficijent korelacije negativna vrijednost, prognoza rezultata u takvom slučaju nije opravdana .
N
Veličina efekta (Cohenov d) ne ovisi o veličini uzorka.
T
Veličina efekta (Cohenov d) ne ovisi o veličini uzorka.
T
Scheffeov test je opravdano koristiti samo kada dobijemo f-omjer značajan kako kod zavisnih tako kod nezavisnih.
N (samo kod nzv)
Kod zavisnih uzoraka dobro je što sudionici sami sebi služe kao kontrola.
T (manji je varijabilitet kad su isti sudionici)
Kod složene analize varijance zbroj kvadrata između grupa sadrži ZK1, ZK2, i ZK interakcije.
T
Kod jednostavne analize varijance F-omjer predstavlja omjer zbroja kvadrata između grupa i zbroja kvadrata unutar grupa.
N (prosječni kvadrat između i unutar grupe)
F-omjer i t-test dijele u načelu istu logiku: omjer razlike i njezine pogreške
T
Ukoliko je kod složene analize varijance djelovanje oba faktora izazvano slučajem znači da ja i interakcija nastala kao posljedica slučaja.
N
Povećanje variranja unutar grupa utječe na smanjenje F-omjera.
T
Distribucija r za r=0.8 je pozitivno asimetrična.
N
Rho koeficijent korelacije ne smijemo računati ako varijable nisu linearne.
N
Ako je korelacija između 2 varijable r=-0.46, možemo nacrtati 2 pravca regresije.
T
Koeficijent determinacije pokazuje proporciju zajedničkih faktora za obje varijable.
T
Kada bismo izbacili ekstremne vrijednosti iz grupa došlo bi do povećanja F- omjera.
N
Maksimalna vrijednost koeficijenta kontingencije (C) ovisi o broju ćelija.
T
Pogreška prognoze će biti manja što je korelacija među varijablama manja.
N
Značajnost multiple korelacije provjerava se F-testom.
T
Wilcoxonov test zahtjeva da su rezultati na intervalnoj skali.
T
Ako vrijednost H iznosi 1 to znači da možemo reći da je nul- hipoteza točna.
T (iz tablica za χ2-test se vidi da je za 1 p>0,05, čak i 0.10)
Point-biserijalni koef. se računa sa 1 kontinuiranom i 1 umjetno dihotomnom varijablom.
N (prirodno dihotomnom)
Rho koeficijent korelacije nije opravdano računati ako barem jedna distribucija nije normalna ili simetrična.
N
Vrijedi odnos: što veća povezanost to veći i rezidualni varijabilitet.
N
Ako koef. multiple krelacije iznosi R=0.85, to znači da ni jedan prediktor pojedinačno ne može imati veću korelaciju s kriterijem od r=0,85.
T
Pravilo je da je veličina korelacije u proporcionalnom odnosu s veličinom uzorka: što je veći N (broj parova rezultata) to je veća korelacija.
N
Koeficijent multiple korelacije ne može se računati kada je povezanost između prediktora i kriterija te prediktora međusobno izražena Rho koeficijentom korelacije.
T
Koeficijent korelacije r možemo izračunati iz podataka gdje su nam poznate samo standardne devijacije bruto rezultata u obje varijable.
N
Kada povezanost između dvije varijable nije linearna, primjena koeficijenta rang korelacije opravdana je samo ako se radi o zakrivljenoj korelaciji koja ne mijenja smjer.
N
Opravdano je kvadrirati biserijalni koeficijent korelacije kako bismo odredili koeficijent determinacije.
N
Ako na istim podacima u jednoj kontingencijskoj tablici 3x3 izračunamo koeficijent kontingencije (C) i Cramerov Fi, dobit ćemo brojčano različite veličine koeficijenta korelacije.
T
Moguće je da korelacija između pojedinog prediktora i kriterija bude jednaka multiploj korelaciji , gdje uz spomenuti postoji još jedan prediktor.
T
Statistička značajnost koeficijenta multiple korelacije ovisi o broju prediktora koji se koristi pri računu multiple korelacije.
N
Kada za neki rezultat u X varijabli prognoziramo najvjerojatniji rezultat u Y varijabli, točnost prognoze ovisi o veličini N-a (uzoraka).
N (o SD i M)
Fi koeficijent korelacije može iznositi jedan (Fi=1) samo u iznimnim slučajevima kada su marginalnte frekvencije u kategorijama varijabli jednake po broju.
T
Nekorigirani koeficijent kontingencije teoretski može biti to veći što ima manji broj kategorija kontingencijske tablice.
N (u proporcionalnom su odnosu)
Što je N (broj parova rezultata) veći, to koeficijent korelacije može biti manji, a da bi bio statistički značajan.
T
Na temelju samo poznavanja pogreške prognoze i standarne devijacije u prognoziranoj varijabli, može se izračunati Pearsonov koef. kor.
T
Indeks rezidualnog varijabiliteta i veličina korelacije su u proporcionalnom odnosu: što je veći indeks rezidualnog varijabiliteta, veća je i korelacija.
N (obrnuto proporcionalnom)
Spearmanov koeficijent korelacije (ρ) opravdano je računati ako distribucije nisu normalne.
T
Kada je rxy=0.80, onda ćemo za neki rezultat u X varijabli predviđati (prognozirati) u Y varijabli rezultat koji je jednak aritmetičkoj sredini Y varijable.
N (to bi radili ako nema povezanosti; ovdje računamo po formuli)
Koeficijent korelacije rxy=0.80 može biti statistički neznačajan.
T
Vezani rangovi načelno dovode do nerealnog povećanja rang koef. kor.
T
Ukoliko povezanost nije linearna, a mi računamo Pearsonov koef. kor, onda će on u pravilu biti veći od koeficijenta korelacije koji bi se trebao računati za slučaj nelinearne povezanosti.
N (bit će manji)
Odnos koeficijenta korelacije i koeficijenta determinacije je linearan.
N (eksponencijalan)
Ukoliko želimo testirati statističku značajnost između 2 koeficijenta korelacije, možemo koristiti t-test, ali prethodno moramo koeficijente korelacije pretvoriti u Fischerove z-vrijednosti.
T
Koeficijent korelacije r možemo izračunati iz podataka gdje su nam poznate samo standardne devijacije bruto rezultata u obje varijable.
N
Ukoliko je zadovoljena pretpostavka o homoscedascitetu, znači da se isključivo radi o umjereno visokoj i pozitivnoj korelaciji.
N
Test ekvivalentnih parova zahtjeva najmanje rangovnu mjernu ljestvicu.
N (Kruskal-Wallisov)
Distribucije F-omjera za neke stupnjeve slobode u pravilu su pozitivno asimetrične.
T
Budući da se račun temelji na hi-kvadrat testu određenom tablicom 2x2, prilikom računanja Fi koeficijenta korelacije potrebno je računati Yaetsovu korekciju.
N
Rang test zasniva se na minimalno omjernoj ljestvici
N
Distribucija F-omjera je simetrična.
N
Pearsonov koeficijent korelacije na rangovnim podacima predstavlja korigirani Spearmanov koeficijent korelacije.
T
Nakon provedene analize varijance uvijek je potrebno učiniti i post hoc testove za utvrđivanje razlika između pojedinih skupina.
N
Scheffeov postupak je nešto manje strog od t-testa.
N
Test predznaka ne uzima u obzir veličinu razlike između mjerenja nego samo njezin smjer.
T
Cohenov d, kojim se izražava veličina učinka, ne ovisi o broju ispitanika.
T
Budući da snaga (ovisi/ne ovisi) o veličini uzorka, što je veća veličina uzorka, to će snaga biti (manja/veća/jednaka).
Ne ovisi; jednaka
Što je koeficijent rezidualnog varijabiliteta veći to znači da je i manje varijabiliteta u Y varijabli objašnjivo varijabilitetom u X varijabli.
T
Značajnost koeficijenta zakrivljene korelacije testira se t-testom.
N
Kod Wilcoxonovog testa ekvivalentnih parova prilikom postupka rangiranja razlika važno je voditi računa o predznacima (o tome je li razlika pozitivna ili negativna).
N
Korekcija zbog vezanih rangova kod Rho koeficijenta korelacije može se napraviti tako da se na rangovima izračuna r koeficijent korelacije.
T
Korekcija zbog vezanih rangova kod Rho koeficijenta korelacije može se napraviti tako da se na rangovima izračuna r koeficijent korelacije.
N (nije isključivo)
Razlozi varijabiliteta između i unutar grupa?
između: djelovanje nzv
unutar: pogreška mjerenja i pogreška uzorkovanja
Kod računa Fi-koeficijenta korelacije na temelju hi-kvadrat testa, ukoliko je ukupni N mali, treba koristiti Yatesovu korekciju.
N
Ukoliko imamo nacrt 2x2x2, onda provedbom višesmjerne analize varijance testiramo 7 nul-hipoteza.
T (2 + 2 + 2 + 1(interakcija) = 7)
Analiza varijance za zavisne uzorke ima veću snagu od one za nezavisne uzorke.
T
Koeficijent kontingencije može biti bilo koji broj između -1 i 1.
N
Friedmanov test zahtijeva minimalno ordinalnu mjernu ljestvicu.
T
Dvije varijable kojima mjerimo istu stvar dijele 100% zajedničke varijance.
T
Složenu analizu varijance koristimo kada imamo dvije varijable, jednu nezavisnu i jednu zavisnu.
N
U grafičko-statističkom smislu, veličina učinka je razlika između dviju distribucija rezultata, koliko se ne preklapaju ili preklapaju.
T
Za Pearsonov koef. korelacije možemo izračunati njegovu pogrešku.
T
Ako koristimo rang test onda će teoretska suma rangova u jednoj skupini uvijek biti jednaka teorijskoj sumi rangova u drugoj skupini.
N
Kada imamo dvije skupine rezultata pri testiranju, pri testiranju značajnosti razlike između njihovih aritmetičkih sredina opravdano je i dozvoljeno koristiti postupak analize varijance.
T
Biserijalni koeficijent korelacije je u stvari Pearsonov koeficijent korelaacije između kontinuirane varijable i stvarno dihotomne varijable.
N
Ako imamo faktorijalni nacrt 4x4x4 (nezavisne skupine ispitanika), u istraživanju ćemo imati 64 nezavisnih skupina ispitanika.
T
Cramerov fi je parametrijski koeficijent korelacije.
N
Ukoliko imamo nacrt 2x2 onda provedbom višesmjerne analize varijance testiramo 4 nul hipoteze
N
Analizu varijance ne možemo izračunati ako imamo samo 2 skupine podataka.
N
Podatke koji se odnose na interakciju između dviju varijabli u višesmjernoj analizi varijance možemo grafički prikazati na dva načina – tako da na os x stavimo prvu NV, a na os y drugu NV i obrnuto.
N
Ako grupiramo rezultate u razrede, to neće značajno mijenjati koeficijent korelacije samo onda ako broj razreda nije mali.
T
F-omjer u nezavisnoj analizi varijance je omjer sume kvadrata između grupa i sume kvadrata unutar grupa.
T
F-omjer u nezavisnoj analizi varijance je omjer sume kvadrata između grupa i sume kvadrata unutar grupa.
T
Izračunamo li korelaciju na rezultatima koji su grupirani u mali broj razreda, ona će se najvjerojatnije razlikovati od korelacije koju dobijemo kada računamo s bruto rezultatima.
T
Teorijski gledamo, F-omjer za interakciju nikada ne bi smio biti < 2.58
N
Svi uvjeti koji postoje za izračunavanje hi-kvadrat testa vrijede i za izračunavanje medijan testa.
T (jer se on svodi na χ2-test)
Kada imamo jednu varijablu koja se prirodno dijeli u 3 kategorije, a druga je varijabla kontinuirana i na intervalnoj ljestvici, možemo računati point-biserijalni koef. kor.
N
Z-vrijednosti koje koristimo u nekim neparametrijskim postupcima nisu one iste z-vrijednosti o kojima govorimo kada govorimo o normalnoj distribuciji.
N
Vezani rangovi umjetno smanjuju rang korelaciju.
N (povećavaju)
Indeks efikasnosti prognoze može biti bilo koji broj u rasponu od 0 do beskonačno.
N
Vjerojatnost pojave alfa pogreške manja je kod Scheffeovog postupka nego kod t-testa.
T
Varijanca između grupa kod jednosmjerne analize varijance za nezavisne podatke isključivo je rezultat djelovanja nezavisne varijable.
N (NV+NVF) (NV, tj. tretman+NVF, tj. reziduali)
U složenoj analizi varijance s 3 nezavisne varijable, moguće je dobiti značajna sva 3 glavna efekta, ali niti jednu interakciju.
T
Koeficijent multiple korelacije može biti manji čak i od 0.20 a da bude statistički značajan.
T (uz veliki uzorak)
Kada parcijaliziramo utjecaj treće varijable na neke dvije varijable između kojih smo računali korelaciu, moguće je da nakon parcijalizacije prvotno pozitivna korelacija postane negativna.
T
Ukoliko računanjem jednostavne analize varijance na nezavisnim uzorcima dobijemo vrlo velik i značajan F-omjer (F=201, df=3/156, p<0.01) možemo biti sigurni da je i razlika između svih pojedinih grupa statistički značajna.
N
Ako je koeficijent korelacije negativna vrijednost, prognoza rezultata u takvom slučaju nije opravdana.
N
Ako bismo u slučaju nelinearne povezanosti računali Pearsonov koeficijent korelacije, dobiveni r bio bi podcijenjena vrijednost (manja) realne povezanosti.
T
Distribucija F-omjera za neke stupnjeve slobode uvijek je normalna distribucija.
N
Postoji statistički postupak kojim možemo izračunati sukladnost u variranju između dvije varijable mjerena na nominalnoj ljestvici.
T
Ako na istim rezultatima, koji su po prirodi zavisi, izračunamo dva F-omjera (jedan za zavisne, a drugi za nezavisne uzorke), F-omjer za zavisne uzorke imat će manju vjerojatnost slučajne pojave.
T
Uz dovoljno velik N i r=0 može biti statistički značajan.
N
Što imamo veći broj stupnjeva slobode (oba) kod analize varijance, F-omjer načelno može biti manji, a da bi bio statistički značajan.
T
Izračunati Eta koeficijent pokazuje nam stupanj i smjer zakrivljene povezanosti između dviju varijabli.
N (ne može biti negativna vrijednost)
Statistička značajnost point-biserijalnog koeficijenta korelacije određuje se preko značajnosti biserijalnog koeficijenta korelacije.
N
Najniža razina mjerenja koju Friedmanov test može koristiti je omjerna skala.
N
Ako na istim podacima iz jedne kontingencijske tablice 4x4 izračunamo K-koeficijent korelacije i Cramerov fi koef. kor., onda će K-koeficijent (korigirani) biti niža vrijednost.
N
Temeljni razlog upotrebe analize varijance pred više t-testova između pojedinih parova M-ova jest smanjenje vjerojatnosti pogreške tipa II (beta).
N (pogreške I (alfa))
Pravilo je da je veličina koeficijenta korelacije (r) u proporcionalnom odnosu s veličinom uzorka, što je veći N (broj parova rezultata), to je veća i korelacija.
N (Korelacija u uzorku može varirati ovisno o uzorcima podataka, ali neće rasti samo zbog povećanja broja parova rezultata.)
Oblik distribucije koeficijenta korelacije r, dobiven na velikom broju uzoraka, ovisi o stvarnoj korelaciji u populaciji kao i o veličini uzorka (tj. o broju parova).
T
Test ekvivalentnih parova ima veću stat. snagu od testa predznaka.
T
Ako je varijabilitet unutar grupa manji od varijabiliteta između grupa, ovisno o stupnjevima slobode postoji šansa da je razlika testirana analizom varijance u tom slučaju statistički značajna.
T
Ako na nezavisnim podacima računamo analizu varijance prema algoritmu za zavisne, to je u statističkom smislu veća pogreška nego obrnuto (ako na zavisnim podacima računamo analizu varijance po algoritmu za nezavisne).
T