Statistika Flashcards
Distribucija F-omjera kao i distribucija t-omjera su simetrične distribucije.
N
Ukoliko se aritmetičke sredine između nekih skupina podataka zaista razlikuju, omjer varijance unutar grupa i između grupa trebao bi biti oko 1 nakon izračuna jednostavne analize varijance.
N
Statistička snaga jest vjerojatnost odbacivanja točne nul-hipoteze.
N (prihvaćanje/netočne)
Načelno vrijedi, što je veći hi-kvadrat test to ima veću šansu da bude proglašen statistički značajnim.
T
Opravdano je računati aritmetičku sredinu i standardnu devijaciju ako imamo veliki N (N>1000) a podatke na nominalnoj ljestvici/skali.
N
Podaci za računanje Wilcoxonovog testa ekvivalentnih parova nalaze se na ordinalnoj skali.
N (na intervalnoj ili omjernoj)
….statistička značajna razlika…. čak i kada je povezanost mala npr r=0.34. (nedovršeno pitanje)
T
U nekim je slučajevima opravdano računati i hi kvadrat (kao neparamaterisjki postupak) i t test (kao parametrijski postupak).
T
Što su točke na dijagramu raspršenja bliže jedna drugoj, to znači da je:
a) korelacija među varijablama viša
b) korelacija među varijablama manja
c) pogreška prognoze manja
d) nema utjecaj na korelaciju
a) i c)
Za koeficijent parcijalne korelacije ne vrijedi:
a) ss=N-3
b) znacajnost se testira t-testom
c) ne može biti negativna vrijednost
d) pretpostavlja linearnu povezanost između
sve tri varijable
e) ništa od navedenog
d)
Nul-hipoteza bit će točna za slučaj da je varijanca unutar grupa:
a) veća od varijance između grupa
b) manja od varijance između grupa
c) jednaka varijanci između grupa
d) sve od navedenog.
a) i c)
Nije opravdano računati Spearmana kada:
a. je jedna asimetrična distribucija
b. je raspon rezultata ograničen
c. kada nije linearna povezanost među varijablama
d. ništa od navedenog
e. sve od navedenog
d)
Varijabla čiju vrijednost predviđamo na temelju pravca regresije nazivamo…
kriterijska
Kojim statističkim postupkom provjeravamo je li distribucija normalna?
Hi kvadrat.
Generalno, možemo reći da distribucije stupnjeva slobode za hi-kvadrat test imaju oblik…
hint: … distribucije
pozitivno asimetrične distribucije
Ukoliko je odnos između dvije varijable zakrivljen računamo…
eta koeficijent korelacije
Slaganje između više vezanih rangova računamo…
hint: koeficijentom
koeficijentom konkordancije (W)
Ako je nul hipoteza TOČNA (tj. ne postoji razlike među rezultatima različitih skupina ispitanika), odnos varijabiliteta unutar i između grupa jednak je približno 1.
T
Generalno, možemo reći da distribucije stupnjeva slobode za hi-kvadrat test imaju oblik…
pozitivno asimetrične distribucije
Temeljna pretpostavka generalnog linearnog modela jest da su njegove komponente međusobno nezavisne.
T
Razlika između t-testa i Schefféovog postupka u tome je što se kod t-testa u nazivniku koristi pogreška razlike između aritmetičkih sredina, a kod Schefféovog postupka u nazivniku se nalazi prosječni kvadrat koji pokazuje variranje između svih grupa ispitanika.
T (t-test koristi standardnu pogrešku razlike između aritmetičkih sredina u nazivniku, dok Schefféov postupak koristi prosječni kvadrat greške koji pokazuje variranje između svih grupa ispitanika)
Kada testiramo da li se neka distribucija rezultata razlikuje od kvadratične distribucije to radimo pomoću x^2 testa.
T
Da li se neka distribucija rezultata razlikuje od kvadratične distribucije možemo provjeriti pomoću…
hi-kvadrat testom
Kako raste broj asimetričkih sredina između kojih testiramo značajnost razlike, tako linearno raste i vjerojatnost pogreške tipa I., prema formuli 1- (1-α) n.
T
Pri određivanju zbrojeva kvadrata kod jednostavne analize varijance, računanje totalnog (ukupnog) zbroja kvadrata služi za preciznije formiranje F-omjera.
N (F-test se formira pomoću zbroja kvadrata između i zbroja kvadrata unutar grupa)
U iznimnim slučajevima, ukoliko je N>1000, x^2 test je opravdano računati na proporcijama.
N
Ista vrijednost F-omjera vjerojatnije će biti značajna za stupnjeve slobode ss=3,4, nego za ss=4,3.
T
Kod računanja jednostavne analize varijance za tri skupine podataka alternativna hipoteza može glasiti µ1≠ µ2≠µ3.
N (alternativna hipoteza ne specificira da su sve sredine različite jedna od druge (što bi značilo 𝜇1≠𝜇2≠𝜇3), već samo da postoji barem jedna razlika između grupnih sredina)
Ukoliko imamo N=30 sudionika, podijeljenih u tri skupine, broj stupnjeva slobode grupa je 3.
N (broj grupa - 1 = 3 - 1 = 2)
Varijabilitet između grupa, koji računamo u analizi varijance, posljedica je djelovanja varijable α (nezavisne varijable).
T
Varijanca UNUTAR grupa pod utjecajem je nesistematskih varijabilnih faktora.
T
Kod računanja složene analize varijance izvor varijabilteta unutar grupa jednak je sumi varijabiliteta nastalog djelovanjem glavnog faktora i pogreške.
N (varijabilitet unutar grupa je isključivo varijabilnost koja nije objašnjena efektima glavnih faktora ili njihovim interakcijama, tj. to je pogreška (rezidualna varijabilnost))
Interakcija se pojavljuje kad kombinirano djelovanje dvaju ili više nezavisnih varijabli ima poseban učinak koji se ne može predvidjeti iz poznavanja učinka svake od nezavisnih varijabli za sebe.
T
Ukoliko se aritmetičke sredine između nekih skupina podataka zaista razlikuju, omjer varijance između grupa i unutar trebao bi biti oko 1 nakon izračuna jednostavne analize varijance.
N
Korištenje Yatesove korekcije gubi smisao ukoliko…
su razlike između opaženih i očekivanih frekvencija toliko male (<0.25) da bi njihovo smanjenje za 0.5 rezultiralo većim brojem
Kada računamo jednostavnu analizu varijance na ZAVISNIM podacima, zanima nas omjer varijance unutar sudionika i varijance između sudionika.
N
Pri određivanju zbrojeva kod jednostavne analize varijance, računanje totalnog (ukupnog) zbroja kvadrata služi za preciznije formiranje F-omjera.
N (ukupni zbroj kvadrata se koristi za ukupnu procjenu varijabilnosti podataka, ali ne služi direktno za formiranje F-omjera)
Kad se na istim ispitanicima provode mjerenja zavisne varijable u različitim eksperimentalnim situacijama onda svaki ispitanik služi kao kontrola svakom drugom ispitaniku.
N
Računajući jednostavnu analizu varijance na NEZAVISNIM podacima želimo saznati omjer varijance između sudionika i varijance unutar sudionika.
T
Vrijednost hi kvadrat testa NE može biti negativnog predznaka.
T
Hoće li neka (ista) vrijednost x^2 biti značajna ili ne ovisi o broju opažanja kojima baratamo.
T
Kada testiramo da li se neka distribucija rezultata razlikuje od normalne distribucije, jedan od uvjeta koji mora biti zadovoljen je to da opažene frekvencije u svakoj ćeliji ne smiju biti manje od 5.
N (teoretske/očekivane)
Za F-distribuciju vrijedi da je negativno asimetrična.
N (pozitivno)
Kako nazivamo tablicu koja nam služi kao osnova za izračunavanje hi-kvadrat testa?
Kontingencijska tablica.
Ukoliko nakon završenog računa analize varijance ostanemo pri Ho, NIJE opravdano vršiti pos-hoc analize.
T
Kada je neki F-omjer značajan uz nivo rizika od 1% to sigurno znači da je značajan i uz rizik od 5%.
T
Načelno, distribucija F-omjera kao i distribucija t-omjera, je simetrična distribucija.
N
Distribucija F-omjera, kao i distribucija t-omjera, je normalna distribucija.
N
Ako su razlike između opaženih i očekivanih frekvencija vrlo male tako da primjenom Yatesove korekcije dobijemo razliku koja je numerički veća (bez obzira na predznak), onda upotreba te korekcije nema opravdanja.
T
Nul-hipoteza bit će točna za slučaj da je varijanca unutar grupa jednaka varijanci između grupa.
T
Kod računanja hi-kvadrat testa, broj opaženih i teorijskih frekvencija mora biti jednak.
T
Kada se koristi Yatesova korekcija?
Kada postoji samo 1 stupanj slobode.
Ako je dobiveni F-omjer < 1, ne možemo reći da su razlike u zavisnoj varijabli među skupinama najvjerojatnije posljedica slučaja.
N
Kada imamo N=48 sudionika, podijeljenih u tri skupine, broj stupnjeva slobode između grupa je 3.
N (g - 1)
Distribucija x^2 vrijednosti, načelno je pozitivno asimetrična.
T
Kod analize varijance za nezavisne podatke F-omjer predstavlja omjer prosječne sume kvadrata između grupa i prosječne sume kvadrata unutar grupa.
T
Jedan od najčešće korištenih pred-testova kod jednostavne analize varijance za nezavisne podatke je Schefféov test.
N
Ukoliko varijabilitet između grupa pada dok varijabilitet unutar grupa raste posljedica će biti porast F-omjera.
N
Ako imamo N=30 sudionika, podijeljenih u tri skupine, broj stupnjeva slobode između grupa je 2.
T
Ukoliko varijabilitet između grupa raste dok varijabilitet unutar grupa opada posljedica će biti porast F-omjera.
T
Ako pri nekom testiranju razlike između različitih skupina odbacimo nul-hipotezu to znači da u različitim skupinama ne postoje jednaki pojedinačni rezultati.
N
Distribucija x^2 vrijednosti, načelno ima oblik negativno asimetrične distribucije.
N (pozitivno)
Ako je nul-hipoteza NETOČNA (tj. postoji razlika između različitih skupina), odnos varijabiliteta između grupa i unutar grupa je oko 1.
N
Kod računanja hi-kvadrat testa, broj opaženih i teorijskih frekvencija ne mora nužno biti jednak.
N
F-omjer ne mora uvijek biti pozitivna vrijednost.
N
Za F-distribuciju vrijedi da nema negativnih vrijednosti.
T
Načelno vrijedi, što je manji hi-kvadrat test to ima veću šansu da bude proglašen statistički značajnim.
N
Značajan F-omjer možemo dobiti samo ako je istraživačka hipoteza stvarno točna, a nul-hipoteza netočna.
N
U društvenim znanostima neuobičajeno je da povezanost dvije varijable bude potpuna ili jako visoka (>0.99).
T
Grupiranje rezultata u razrede utječe na veličinu Pearsonovog koeficijenta korelacije tako da ga SMANJUJE.
N
Jednadžba pravca može poslužiti za predviđanje rezultata u Y-varijabli na temelju poznavanja rezultata u X-varijabli samo ako je povezanost između X i Y varijable linearna.
T
Vrijednost H (dobivena nakon izračuna Kruskal-Walisovog testa) uvijek se interpretira na temelju tablice x^2 kvadrat vrijednosti.
N (??? - nisam sigurna za “uvijek”, ali mi ga interpretiramo na temelju te tablice)
Ukoliko utvrdimo da je povezanost između varijable x i y r=0.5, a nakon toga sve vrijednosti u obje varijable pomnožimo s istom konstantom (npr. 2), ponovno izračunata povezanost ostat će r=0.5.
T
Koeficijent determinacije je mjera koja dodatno može pojasniti dobivenu korelaciju.
T
Krivulja koja spaja točke s koordinatama koje su određene parcijalnim srednjim vrijednostima u jednoj varijabli i fiksnim vrijednostima u drugoj varijabli naziva se…
pravac/crta regresije.
Što je povezanost između dvije varijable manja, to je indeks efikasnosti prognoze…
manji
Značajnost koeficijenta multiple korelacije se određuje uz pomoć F-omjera.
T
Ne postoji ni jedan koeficijent korelacije kojim bi se mogla opisati povezanost između dvije varijable koje su u zakrivljenom odnosu.
N (eta koeficijent korelacije)
Što je povezanost između dvije varijable manja, to je veća standardna pogreška prognoze.
T
Pearsonov r se u suštini temelji na t-vrijednostima.
N (računa se kao omjer kovarijacije i standardnih devijacija varijabli)
Ukoliko između dvije varijable ne postoji korelacija, prilikom regresijske analize predviđeni (najvjerojatniji) Y će biti aritmetička sredina kriterijske varijable.
T
Ukoliko testiramo povezanost između dvije varijable, testiramo sljedeću nul-hipotezu: H0: r=1.
N (r = 0)
Kada je koeficijent korelacije negativnog predznaka onda je i koeficijent determinacije negativnog predznaka.
N (formula r^2 * 100)
Ukoliko smo dobili da je Pearsonov r=0.04, a nismo nacrtali dijagram raspršenja, možemo sa sigurnošću reći da ne postoji povezanost između neke dvije varijable.
N (??? - tehnički se vidi da je povezanost jako mala, ali ništa ne možemo reći sa sigurnošću)
Varijabla čiju vrijednost predviđamo na temelju pravca naziva se prediktorskom.
N (kriterijska; prediktorska je varijabla na temelju koje se predviđa rezultat u y varijabli)
Karakteristika koeficijenta konkordancije (W) je to da ne može biti negativnog predznaka.
T
Ukoliko između bilo koje dvije varijable dobijemo statistički značajnu korelaciju koja iznosi r=0,75, možemo sa sigurnošću reći da smo dobili visoku razinu povezanosti.
N
U rijetkim slučajevima Pearsonov r može biti veći od 1.
N
Pearsonov r se u suštini temelji na z-vrijednostima.
T
Ukoliko imamo N<15, a podaci su izraženi na omjernoj ljestvici opravdano je koristiti Pearsonov koeficijent korelacije.
N
Linearni porast vrijednosti koeficijenta determinacije u funkciji je linearnog rasta koeficijenta korelacije na temelju kojeg se računa.
N (???)
Za neparametrijske testove karakteristično je da u svim slučajevima imaju manju snagu od parametrijskih testova.
N (ne UVIJEK, Friedmanov ima istu snagu ko i ANOVA za zavisne, Petz kaže „gotovo jednaku“ ergo kockamo se s N-om)