STAT USMENI Flashcards
1
Q
- Frekvencije i graficko predstavljanje raspodela frekvencija
A
- X je obelezje koje najednom elementu stat skupa uzima jednu vredost iz {x1,…,xn}
- Kada se utvrdi koliko elemenata stat skupa moze uzeti vrednost xi, dobija se raspodela apsolutnih frekvencija.
- Ako je X neprekidnog tipa i ako uzima vrednosti iz intervala (a,b), podelom na k podintervale, pri cemu je a0 = a, ak = b, nazvacemo grupnim intervalom
- Za svaki grupni interval i za svaku vrednost obelezja x odredimo relativnu frekvenciju pi = fi / n
- Realtivne frekvencije su brojevi koji zadovoljavaju uslov:
pi >= 0;
suma pi = 1; - Iz raspodele apsolutnih frekvencija vrednost kumulativne funkcije dobija se kada se sve prethodne saberu. ci = f1+f2…
- Realtivne kumulativne funkcije Fi dobijaju se deljenjem kumulativne frekvecnije ci sa brojem elemenata Fi = ci / n
- Na X osi se nalaze elementi x, na Y osi se nalaze vrednosti frekvencija, konstruisu se pravougaonici iznad grupnih intervala koji imaju visinu frekvencije.
- Histogram sluzi za prikazivanje raspodela relativnih frekvencija gde ce pravougaonici imati povrsinu jednaku vrednsotima relativnih frekvencija.
2
Q
- Mere centralne tendencije?
A
- Aritmeticka sredina niza brojeva je broj koje se dobija kada se njihov zbir podeli sa ukupnim brojem clanova tog niza. X(nadvuceno) = 1/n suma xi;
- Ako je obelezje X neprekidnog tipa uzimaju se sredine intervala
- Ako su sve vrednosti na skupu jednake onda je aritmeticka sredina jednaka tom broju
- Xvar > x - gde je x najmanja vrednost
- Xvar < x’ - gde je x’ najveca vrednost
- Geometrijska sredina niza brojeva je n-ti koren iz proizvoda njegovih clanova. G = n-ti koren(x1*x2…)
- Sve vrednosti moraju biti pozitivne.
- Harmonijska sredina niza brojeva je reciprocna vrednost aritmeticke sredine reciprocnih vrednosti clanova tog niza:
1/H = 1/N suma 1/xi - Modus je ona vrednost koja ima najvecu frekvenciju u posmatranom stat skupu ili ona vrednost u cijoj se okolini najcesce ponavljaju izmerene vrednosti na stat skupu.
- Medijana je ona vrednost X koja deli stat skup na dva jednaka dela
3
Q
- Mere varijabiliteta?
A
- Sto je manje varijabiliteta toliko je srednja vrednost dobar pokazatelj obelezja.
- Razmak varijacije - razlika izmedju najvece i najmanje vrednosti na X: R = Xmax - Xmin
- Kvartilna devijacija - Q = X0,75 - X0,25 / 2
- Srednja devijacija - je aritmeticka sredina apsolutnih vrednosti odstupanja X od njegove aritmeticke sredine Xvar na stat skupu: em = 1/N suma |Xi - Xvar|;
- Varijansa je aritmeticka sredina kvadrata odstupanja vrednosti X od njegove aritmeticke sredine : S2 = 1/N suma Xi2 - Xvar2
- Standardna devijacije je pozitivan koren varijanse: S = + koren S2;
- Koeficijent varijacije je procentualno izrazen odnos standardne devijacije i aritmeticke sredine X: V = S/Xvar *100%;
4
Q
- Momenti stat obelezja?
A
- Obican momenat reda k je matematicko ocekivanje k-tog stepena X: mk= E(Xk) (prekidno *pi, neprekidno integral)
- Centralni momenat reda k je ocekivana vrednsot k-tog stepena razlike X i ocekivane vrednosti m obelezja X:
miK = E(X-m)k (prekidno *pi, neprekidno integral) - Veza izmedju centralnih i obicnih momenata:
(x-m)^k = suma (-1)^k-1(k nad i)m^k - i X^i
5
Q
- Pirsonovi koeficijenti?
A
- Prvi Pirsonov koeficijent (asimetrije)
beta1 = mi3 / S3 = 1/Nsuma xi^3 - m^3
beta = 0 - raspodela je simetricna
beta > 0 - raspodela je asimetricna u levo
beta < 0 - raspodela je asimetricna u desno - Drugi Pirsonov koeficijent(spljostenosti)
beta2 = mi4 / S4 = 1/N suma Xi^4 - m^4
beta2 = 3 - normalna spljostenost
beta2 > 3 - spljostenost veca od normalne
beta2 < 3 - spljostenost manja od normalne
6
Q
- Populacija, uzorak, statistike, verodostojnost uzorka?
A
- Statisticki skup je populacija, a podskup uzorak.
- Skup raspolozivih podataka je uzorak, a pojava za koju se posmatraju je populacija
- Prost slucajni uzorak - verovatnoca izbora jednog elementa u uzorku ne zavisi od verovatnoca ostalih elemenata
- Sistematski uzorak - na slucajna nacin se bira prvi element, a zati se iz populacije uzima svaki k-ti element
- Stratifikovan uzorak 0 . ako je populacija podeljenja na stratume, iz svakog se uzima odgovarajuci broj elemenata.
- Prost slucajni uzorak - rezultat n nezavisnih ponavljanja eksperimenta bice skup slucajnih promenljivih x1…xn koje su medjusobno nezavisni i sve imaju istu raspodelu kao i X.
- Verodostojnost uzorka:
- Prekidnog tipa - f(x1…xn) = Pp(Xi) - funkcija f(x1…xn) je funk verodostojnosti uzorka
- Neprekidnog tipa - f(x1…xn) = Pf(Xi)
- Uzorak (x1…xn) je slicajna promenljiva i svaka funkcija tog uzorka je takodje slucajna promenljiva i takva funkcija predstavlja parametar uzorka i zove se statistika. Z = f(x1…xn)
- Raspodelu tj zakon verovatnoce statistike Z odredjujemo na osnovu funkcije verodostojnisti uzorka
- Da bi se odredila raspodela, potrebno je odrediti ksup svih mogucih vrednosti, a zatim verovatnoce tih vrednosti.
7
Q
- Sredina uzorka, varijansa uzorka?
A
- Aritmeticka sredina uzorka/ Sredina uzorka je statistika data funkcijom Xvar = 1/N suma Xi
- Za dovoljno velike uzorke mozemo reci da ce se sredine uzorka i populacije malo razlikovati.
- Kod vecih uzoraka varijansa je manja i tezi 0 kad n tezi beskonacno, tj. verovatnoca da ce se Xvar naci u maloj okolini broja m tezi 1.
- Ako pretpostavimo da X ima normalnu raspodelu, tj N(m,sigma^2), to ce znaciti da ce sredina uzorka imati normalnu rapodelu N(m; sigma^2/n)
- Statistika Z = Xvar - m / sigma * koren(n) ima standardizovanu sredinu uzorka koji ima standardizovanu normalnu rapspodelu.
- Centralna granicna teorema: Ako je m ocekivana vrednost a varijansa sigma^2 tada raspodela sredine Xvar uzorka tezi normalnoj raspodeli sa ocekivanjem m i varijansom sigma^2/N kad n neograniceno raste.
- Nek su Xvar i S^2 sredina i varijansa uzorka iz populacije sa normalnom raspodelom:
1. Xvar i S^2 su medjusobno nezavisne
2. Sredina uzorka ima normalnu raspodelu
3. Statistika nS^2/sigma^2: Xi^2 n - 1;
8
Q
- Tackaste ocene, nepristrasne ocene parametra?
A
- Ocena parametra populacije je statistika definisana na uzorku i predstavalja tackastu ocenu nepoznatog parametra.
- Vazan je izbor funkcije f jer od nje i zavisi u kojoj meri je data ocena nepoznatog parametra dobra.
- Ocekivana vrednost statistike f(x1…xn) kojom se ocenjuje nepoznati parametar teta^ pozeljno je da bude bas teta.
Ako je ovaj uslov ispunjen onda je teta^ = f(x1…xn) nepristrasna ocena nepoznatog parametra.
E(teta^) > teta - pozitivno pristrasna
E(teta^) < teta - negativno pristrasna - Nepristrasna ocena obezbedjuje da na osnovu veceg uzorka iz iste populacije u proseku tacno odredimo vrednost nepoznatog parametra.
9
Q
- Ocene sa minimalno varijansom?
A
- Ocena teta^ parametra teta bice dobra ako je blizu prave vrednosti tog parametra, pa je potrebno odrediti meru bliskosti ocene i nepoznatog parametra
1) P{teta - landa 1 < teta^ < teta + landa2}
2) P{teta - landa 1 < teta1^ < teta + landa2} - Ako je verovatnoca 1 uvek veca od verovatnoce 2 i to za svako landa1,landa 2, onda je statistika teta bolja ocena od statistika teta1.
- Varijansa statistike koja predstavlja nepristrasnu ocenu zove se srednja kvadratna greska ocene
- Najbolja nepristrasna ocena nepoznatog parametra bice ona cija varijansa ima minimalnu vrednost u odnosu na sve ostale nepristransne ocene, tj: Var(teta^) <= Var(tetai^);
10
Q
- Efikasne ocene?
A
- Kako je za parametar teta populacije potrebano naci ocenu teta^ koja ce biti bolja ako je njena varijansa manja, izraz E(teta^ - teta)^2 tj. srednja kvadratna greska ocene parametra se moze smatrati merom efikasnosti te ocene.
- Sto je ta vrednost bliza 0, to je ocena efikasnije.
- Efikasnost ocene teta^ parametra teta je kolicnik minimalne srednje kvadratne greske i srednje kvadratne greske ocene teta^: Ef(teta^) = E(teta0^ - teta)^2/E(teta^ - teta)^2; gde je teta0^ ocena koja ima najmanju srednju kvr gresku
- Za nepristrasne ocene, efikasnos ocene teta^ je kolicnik varijansi Ef(teta^) = Var(teta0^)/Var(teta^)
- Efikasnost ocene je broj koji ispunjava uslov: 0 <= Ef(teta^) <= 1 ( ako je jednako 1, ocena je efikasna)
11
Q
- Optimalne ocene?
A
- Najbolje nepristrasna ocena nepoznatog parametra bice ona cija varijansa ima minamlanu vrednost u odnosu na sve ostale nepristrasne ocene tj. Var(teta^) <= Var(teta i^)
- Nepristranse ocena sa minimalnom varijasnom predstavlja optimalnu ocemu parametra teta u klasi nepristrasnih ocena.
12
Q
- Metod maksimalne verodostojnsoti?
A
- Funkcija verodostojnosti za uzorak (x1..xn): L(x1…xn,teta1…tetaK) = P f(xi,teta1…tetak)
- Metod maksimalne verodostojnosti je metod izbora vrednosti parametra modela tako da gunkcije verodostojnosti ima sto vecu vrednost.
- Kako je funkcija logL monotono rastuca, ona ima maksimum za iste vrednosti parametara kao i gunk L; Logaritmovanjem se proizvod transformise u zbir, a tacka u kojoj logL(alfa) dostize maksimum predstavlja resenje sisitema jadnacina.
- Statistika koje se dobija kao resenje sistepa po nepoznatim parametirma teeta1,… tetaK su ocene maksimalne verodostojnosi za nepoznati parametar.
- Efikasnos ocene - ako postoji efikasna ocena parametra teta tada jednacina verodostojnosti ima jedinstveno resenje i to je vas ocena teta^.
- Princip invarijantnosti - Ako je teta^ ocena maks verodostojnosti parametra teta, tada je g(teta^) ocena maks verodostojnosti funkcije g(teta)
- Jednoznacnost resenja - Jednacina verodostojnosti ne mora uvek da ima samo jedno resenje.
13
Q
- Intervali poverenja i opsti postupak odredjivanja intervala poverenja?
A
- Intervali formirani u skladu sa pravilima izvedenim iz TB i statistike predstavljaju intervale povernja za nepoznate parametre populacije, a granice intervala se odredjuju preko uzorka x1…xn
- Na osnovu prostog slucajnog uzorka x1…xn odredjuju se dve statistike: Z1 i Z2
- P{Z1< teta <= Z2} = gama
- P{teta ne pripada [z1,z2]} = 1 - gama
- Verovatnoca gama je nivo poverenja a interval [z1,z2] interval poverenja.
1. Odredjuje se funk uzorka i parametra teta g za koju vazi da je definisana za svaku vrednost teta, da je neprekidna i monotona i da rasoodela funk g ne zavisi od nepoznatog paranetra teta; njen zakon verovatnoca je funk Fi(y)
2. Za dat nivo poverenja gama odredjuju se dve vrednosti g1 i g2 ( integral ), vrednost g1 i g2 su takve da je za svaku sl prom Y koja ima zakon vrv Fi (y) vrv da se Y nadju u intervalu (g1,g2) jednaka gama.
3. Resenje nejednacin:
g(x1…xn;teta) <= g2
g(x1…xn;teta) > g1
z1 < teta <= z2
4. Posto statistika g ima zakon vrv dat funk Fi(y), vrv dogadjaja g1 < g(x1…xn;teta) <= g2 bice jednaka gama.
14
Q
- Interval poverenja za ocekivanu vrednost?
A
- Interval poverenja za srednju vrednost m kada se zna sigma^2 a uzorak iz populacije N(m,sigma^2): Z=Xvar - m/sigma/koren(n)
Fi(Z0) = 1+beta/2
Im = [Xvar - Z0sigma/koren(N);Xvar + Z0sigma/koren(N)] - Interval poverenja za m kada se ne zna sigma^2:
Tau = Xvar - m/S/koren(n-1)
Fn-1(to) = 1+beta/2
Im = [Xvar - toS/koren(n-1);Xvar + toS/koren(n-1)]
15
Q
- Jednostrani i dvostrani intreval poverenja za varijansu?
A
- Jednostrani: Tau = nS^2/sigma^2
Fn-1(Hi0^2) = 1-beta
Isigma^2 = [ 0;nS^2/Hio^2] - Dvostrani: Tau = nS^2/sigma^2
Fn-1(Hi1^2) = 1-beta / 2
Fn-1(Hi2^2) = 1+beta / 2
Isigma^2 = [ nS^2/Hi2^2;nS^2/Hi1^2]
16
Q
- Interval poverenja za razliku matematickih ocekivanja?
A
- Poznate sigma1^2 i sigma2^2 X1: N(m1,sigma1^2/n1), X2: N(m2,sigma2^2/n2)
Tau = X1var - X2var - ( m1 - m2)/ koren(sigma1^2/n1 + sigma2^2 / n2)
Fi(Zo) = 1 + beta / 2;
I(m1-m2) = [X1var - X2var - Zokoren(sigma1^2/n1 + sigma2^2 / n2);X1var - X2var + Zokoren(sigma1^2/n1 + sigma2^2 / n2)]
-Nepoznate sigma1^2 i sigma2^2:
Tau = X1var - X2var - ( m1 - m2)/ koren(n1s1^2 + n2S2^2) * koren(n1n2/n1+n2 * n1+n2-2)
Fn1+n2-2 (to) = 1 + beta / 2;
I(m1-m2) = [X1var - X2var - to* koren(n1S1^2 + n2S2^2)/koren(n1n2/n1+n2(n1+n2-2);X1var - X2var + to* koren(n1S1^2 + n2S2^2)/koren(n1n2/n1+n2(n1+n2-2)]
17
Q
- Interval poverenja za nepoznatu verovatnocu?
A
W - statistika koje predstavlha broj ponavljanja dogadjaja A, cija se verovatnoca ocenjuje u uzorku obima n;
Z* = W* = W - np/koren(np(1-p);
Fi(Zo) = 1 + beta/2
p{|Z*| < Zo} = beta;
p{(w-np)^2 < Zo^2 * np(1-p)} = beta;
p{p^2(n^2 + nZo^2) - p(2Wn +nZo^2) + W^2 < 0} = beta;
Ip[p1^;p2^]
18
Q
- Interval poverenja za koeficijent korelacije?
A
- Dabi odredili interval poverenja za RO koristicemo uzorak (x1,y1)…(xn,yn) i uzoracki koeficijent korelacije:
r = Sxy/SxSy = 1/n suma( xi - xvar)(yi - yvar)/ koren(1/n suma( xi - xvar)^2(yi - yvar)^2 koji predstavlja ocenu koeficijenta korelacije u populaciji; Z = 1/2ln 1+r/1-r - Standardizacijom statistike Z dobija se statistika koja ima standardizovanu normalnu raspodelu Fi(Zo) = 1 + beta / 2;
Iro = [e^2Z1 - 1 / e^2Z1 + 1;e^2Z2 - 1 / e^2Z2 + 1]
19
Q
- Testiranje hipoteze, greske I i II vrste?
A
- Statisticko testiranje hipoteze - teorija utvrdjivanja kriterijuma donosenja odluke na osnovu statistickih podataka i primenom metoda stat analize.
- Ho - nulta hipoteza; H1 - Alternativna hipoteza
- Testiranje hipoteze - postupak za proveru hipoteze na osnovu uzorka.
- Postoje 2 vrste testova:
1. Parametarski testovi - hipoteze se odnose na odredjene parametre populacije, na osnovu osobina raspodele populacije donosimo zakljucke o osobinama uzorka izvucenih iz te populacije, poredimo zakljucke i donosimo odluku o prihvatanju il odbacivanju hipoteze.
2. Neparametarski testovi - oni se najcesce odnose na raspodelu koju obelezje ima odnosno nema . sto je potrebno zakljuciti na osnovu uzorka. - Prosta hipoteza je ona koje se odnosi na samo jednu mogucu vrednot parametara il jednu tacno odredjenu raspodelu.
- Moguce greske:
1) Greska prvog tipa - ako odbacimo Ho a ona je tacna
2)Greska drugog tipa - ako prihvatimo Ho a ona je netacna - Skup vrednosti Rn :
1. Podskup C - kriticna oblast
2. Podskup Rn-C - Greska I vrste: alfa - nivo znacajnosti
Kada je Ho tacna, rezultati uzorka mogu pripasti C il ne
alfa = P{(x1…xn) pripada C|Ho} - ako pripadnu donosimo pogresan zakljucak
1 - alfa = P{(x1…xn) ne pripada C|Ho} - ako pripadnu Rn-C necemo doneti pogresan zakljucak - Greska II vrste: beta
beta = P{(x1…xn) ne pripada C|Ho} - vrv pogresnog zakljucivanja
1 - beta = P{(x1…xn) pripada C|Ho} - vrv tacnog zakljucivanja
20
Q
- Parametarski testovi, proste i slozene hipoteze?
A
- Postupak pri odredjivanju:
1. Definise se statistika Tau = f(x1…xn) na uzorku cija je raspodela koncentrisana oko vrednosti Teta0 kada je tacnaHo a oko vrednosti Teta1 kada je tacna H1
2. Moguce vrednosti statistike Tau se dela na dva dela izborom broja Zo koji ce biti izmedju Teta0 i Teta1
3. Kriticna vrednost Zo odredjuje se tako da vrv dogadjaja Tau > Zo pod uslovom da je Teta = Teta0 bude jedanko alfa: P(Tau > Zo| Teta = Teta0) = alfa;
4. Smanjenjem jedne greske dolazi do povecanja druge zato se alga unapred odredjuje
5. Odluka o prihvatanju il odbacivanju Ho: - Ako je Tau < Zo usvaja se Ho
- Ako je Tau > Zo odbacuje se Ho
- Proste hipoteze se odnose na jednu mogucu vrednost parametra ili na jednu tacno odredjenu raspodelu
- Slozene hipoteze proveravaju vise razlicitih slucajeva.
21
Q
- Testiranje hipoteze o matematickom ocekivanju?
A
- Pretpostavimo da je uzorak x1,…,xn iz populacije sa normalnom raspodelom, da je ocekivana vrednost m nepoznata i testirajmo hipotezu da m ima odredjenu vrednost m0
Ho(m = mo) Tau = Xvar - m / sigma/ koren(n) - sigma ^2 poznata:
Ho( m = mo); H1(m > mo) ( graf je srafiran desno)
Ho( m = mo); H1(m < mo) ( graf je srafiran levo)
Ho( m = mo); H1(m != mo) ( graf je srafiran s obe strane) - sigma^2 nepoznata
Tau = Xvar - m/s/koren(n-1)
22
Q
- Testiranje hipoteza o jednakosti matematickih ocekivanja?
A
- Ho(m1 = m2)
H1 (m1 > m2) - desnostrana
H1 (m1 < m2) - levostrana
H1 (m1 != m2) - obostrana - sigma^2 poznata:
*sigma1^2 != sigma2^2: Tau = (X1var - X2var) - (m1-m2)/koren(sigma1^2/n1 + sigma2^2 / n2)
*sigma1^2 = sigma2^2 = sigma^2: Tau = (X1var - X2var) - (m1-m2)/ sigma * koren(n1n2/n1+n2) - sigma^2 nepoznata:
*mali uzorak: ( < 30)
Tau = (X1var - X2var) - (m1-m2)/koren(n1S1^2 + n2S2^2 * koren(n1n2 / n1+n2 * (n1+n2-2)
*veliki uzorak: ( > 30)
Tau = (X1var - X2var) - (m1-m2)/koren(S1^2/n1 + S2^2/n2)
23
Q
- Testiranje hipoteze o varijanis?
A
- Hi kvadrat test
Ho(sigma^2 = sigma0^2)
H1(sigma^2 > sigma0^2):
Tau = nS^2 / sigma^2 - Ako hipoteza Ho nije tacna, odnostno ako je tacna alternativna hipoteza H1 sigma^2 > sigma0^2 onda je:
Tau - nS^2 / sigma0 ^2, pa ce njena ocekivana vrednost biti veca od (n-1) jer je sigma^2 / sigma0^2 > 1 - Ako je H0 tacna , statistika Tau = nS^2 / sigma0^2 ima Hi kvadratnu raspodelu pa je verovatnoca : P{Tau > Xo|sigma^2 = sigma0^2} = alfa
24
Q
- Testiranje hipoteze o kolicniku varijanse?
A
- Iz populacije sa normalnom rasopdelom uzimaju se 2 uzorka:
x1…xn1
x1…xn2
i odredjuju se varijanse i kolicnik varijansi S1^2/S2^2 - Potrebno je proveriti da li su te razlike slucajne, odnosno proveriti hipotezu Ho(sigma1^2 = sigma2^2)
- Odluka o prihvatanju ili odbacivanju H0 donosimo koristeci F-test: F = sigma2^2/ sigma1^2 * n1(n2-1)S1^2/n2(n1 - 1)S2^2
- Kad je Ho tacna, statistikaF = n1(n2-1)S1^2/n2(n1 - 1)S2^2
ima F raspodelu sa (n1 - 1) i (n2 - 1) stepeni slobode ap je verovatnoca P{Tau > Fo | sigma1^2 = sigma 2^2} = alfa
25
Q
- Testiranje hipoteze o verovatnoci?
A
- Ho ( p = p0)
H1 ( p >, Zo |p = p0} = alfa