STAT USMENI Flashcards

1
Q
  1. Frekvencije i graficko predstavljanje raspodela frekvencija
A
  • X je obelezje koje najednom elementu stat skupa uzima jednu vredost iz {x1,…,xn}
  • Kada se utvrdi koliko elemenata stat skupa moze uzeti vrednost xi, dobija se raspodela apsolutnih frekvencija.
  • Ako je X neprekidnog tipa i ako uzima vrednosti iz intervala (a,b), podelom na k podintervale, pri cemu je a0 = a, ak = b, nazvacemo grupnim intervalom
  • Za svaki grupni interval i za svaku vrednost obelezja x odredimo relativnu frekvenciju pi = fi / n
  • Realtivne frekvencije su brojevi koji zadovoljavaju uslov:
    pi >= 0;
    suma pi = 1;
  • Iz raspodele apsolutnih frekvencija vrednost kumulativne funkcije dobija se kada se sve prethodne saberu. ci = f1+f2…
  • Realtivne kumulativne funkcije Fi dobijaju se deljenjem kumulativne frekvecnije ci sa brojem elemenata Fi = ci / n
  • Na X osi se nalaze elementi x, na Y osi se nalaze vrednosti frekvencija, konstruisu se pravougaonici iznad grupnih intervala koji imaju visinu frekvencije.
  • Histogram sluzi za prikazivanje raspodela relativnih frekvencija gde ce pravougaonici imati povrsinu jednaku vrednsotima relativnih frekvencija.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q
  1. Mere centralne tendencije?
A
  • Aritmeticka sredina niza brojeva je broj koje se dobija kada se njihov zbir podeli sa ukupnim brojem clanova tog niza. X(nadvuceno) = 1/n suma xi;
  • Ako je obelezje X neprekidnog tipa uzimaju se sredine intervala
  • Ako su sve vrednosti na skupu jednake onda je aritmeticka sredina jednaka tom broju
  • Xvar > x - gde je x najmanja vrednost
  • Xvar < x’ - gde je x’ najveca vrednost
  • Geometrijska sredina niza brojeva je n-ti koren iz proizvoda njegovih clanova. G = n-ti koren(x1*x2…)
  • Sve vrednosti moraju biti pozitivne.
  • Harmonijska sredina niza brojeva je reciprocna vrednost aritmeticke sredine reciprocnih vrednosti clanova tog niza:
    1/H = 1/N suma 1/xi
  • Modus je ona vrednost koja ima najvecu frekvenciju u posmatranom stat skupu ili ona vrednost u cijoj se okolini najcesce ponavljaju izmerene vrednosti na stat skupu.
  • Medijana je ona vrednost X koja deli stat skup na dva jednaka dela
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q
  1. Mere varijabiliteta?
A
  • Sto je manje varijabiliteta toliko je srednja vrednost dobar pokazatelj obelezja.
  • Razmak varijacije - razlika izmedju najvece i najmanje vrednosti na X: R = Xmax - Xmin
  • Kvartilna devijacija - Q = X0,75 - X0,25 / 2
  • Srednja devijacija - je aritmeticka sredina apsolutnih vrednosti odstupanja X od njegove aritmeticke sredine Xvar na stat skupu: em = 1/N suma |Xi - Xvar|;
  • Varijansa je aritmeticka sredina kvadrata odstupanja vrednosti X od njegove aritmeticke sredine : S2 = 1/N suma Xi2 - Xvar2
  • Standardna devijacije je pozitivan koren varijanse: S = + koren S2;
  • Koeficijent varijacije je procentualno izrazen odnos standardne devijacije i aritmeticke sredine X: V = S/Xvar *100%;
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q
  1. Momenti stat obelezja?
A
  • Obican momenat reda k je matematicko ocekivanje k-tog stepena X: mk= E(Xk) (prekidno *pi, neprekidno integral)
  • Centralni momenat reda k je ocekivana vrednsot k-tog stepena razlike X i ocekivane vrednosti m obelezja X:
    miK = E(X-m)k (prekidno *pi, neprekidno integral)
  • Veza izmedju centralnih i obicnih momenata:
    (x-m)^k = suma (-1)^k-1(k nad i)m^k - i X^i
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q
  1. Pirsonovi koeficijenti?
A
  • Prvi Pirsonov koeficijent (asimetrije)
    beta1 = mi3 / S3 = 1/Nsuma xi^3 - m^3
    beta = 0 - raspodela je simetricna
    beta > 0 - raspodela je asimetricna u levo
    beta < 0 - raspodela je asimetricna u desno
  • Drugi Pirsonov koeficijent(spljostenosti)
    beta2 = mi4 / S4 = 1/N suma Xi^4 - m^4
    beta2 = 3 - normalna spljostenost
    beta2 > 3 - spljostenost veca od normalne
    beta2 < 3 - spljostenost manja od normalne
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q
  1. Populacija, uzorak, statistike, verodostojnost uzorka?
A
  • Statisticki skup je populacija, a podskup uzorak.
  • Skup raspolozivih podataka je uzorak, a pojava za koju se posmatraju je populacija
  • Prost slucajni uzorak - verovatnoca izbora jednog elementa u uzorku ne zavisi od verovatnoca ostalih elemenata
  • Sistematski uzorak - na slucajna nacin se bira prvi element, a zati se iz populacije uzima svaki k-ti element
  • Stratifikovan uzorak 0 . ako je populacija podeljenja na stratume, iz svakog se uzima odgovarajuci broj elemenata.
  • Prost slucajni uzorak - rezultat n nezavisnih ponavljanja eksperimenta bice skup slucajnih promenljivih x1…xn koje su medjusobno nezavisni i sve imaju istu raspodelu kao i X.
  • Verodostojnost uzorka:
  • Prekidnog tipa - f(x1…xn) = Pp(Xi) - funkcija f(x1…xn) je funk verodostojnosti uzorka
  • Neprekidnog tipa - f(x1…xn) = Pf(Xi)
  • Uzorak (x1…xn) je slicajna promenljiva i svaka funkcija tog uzorka je takodje slucajna promenljiva i takva funkcija predstavlja parametar uzorka i zove se statistika. Z = f(x1…xn)
  • Raspodelu tj zakon verovatnoce statistike Z odredjujemo na osnovu funkcije verodostojnisti uzorka
  • Da bi se odredila raspodela, potrebno je odrediti ksup svih mogucih vrednosti, a zatim verovatnoce tih vrednosti.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q
  1. Sredina uzorka, varijansa uzorka?
A
  • Aritmeticka sredina uzorka/ Sredina uzorka je statistika data funkcijom Xvar = 1/N suma Xi
  • Za dovoljno velike uzorke mozemo reci da ce se sredine uzorka i populacije malo razlikovati.
  • Kod vecih uzoraka varijansa je manja i tezi 0 kad n tezi beskonacno, tj. verovatnoca da ce se Xvar naci u maloj okolini broja m tezi 1.
  • Ako pretpostavimo da X ima normalnu raspodelu, tj N(m,sigma^2), to ce znaciti da ce sredina uzorka imati normalnu rapodelu N(m; sigma^2/n)
  • Statistika Z = Xvar - m / sigma * koren(n) ima standardizovanu sredinu uzorka koji ima standardizovanu normalnu rapspodelu.
  • Centralna granicna teorema: Ako je m ocekivana vrednost a varijansa sigma^2 tada raspodela sredine Xvar uzorka tezi normalnoj raspodeli sa ocekivanjem m i varijansom sigma^2/N kad n neograniceno raste.
  • Nek su Xvar i S^2 sredina i varijansa uzorka iz populacije sa normalnom raspodelom:
    1. Xvar i S^2 su medjusobno nezavisne
    2. Sredina uzorka ima normalnu raspodelu
    3. Statistika nS^2/sigma^2: Xi^2 n - 1;
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q
  1. Tackaste ocene, nepristrasne ocene parametra?
A
  • Ocena parametra populacije je statistika definisana na uzorku i predstavalja tackastu ocenu nepoznatog parametra.
  • Vazan je izbor funkcije f jer od nje i zavisi u kojoj meri je data ocena nepoznatog parametra dobra.
  • Ocekivana vrednost statistike f(x1…xn) kojom se ocenjuje nepoznati parametar teta^ pozeljno je da bude bas teta.
    Ako je ovaj uslov ispunjen onda je teta^ = f(x1…xn) nepristrasna ocena nepoznatog parametra.
    E(teta^) > teta - pozitivno pristrasna
    E(teta^) < teta - negativno pristrasna
  • Nepristrasna ocena obezbedjuje da na osnovu veceg uzorka iz iste populacije u proseku tacno odredimo vrednost nepoznatog parametra.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q
  1. Ocene sa minimalno varijansom?
A
  • Ocena teta^ parametra teta bice dobra ako je blizu prave vrednosti tog parametra, pa je potrebno odrediti meru bliskosti ocene i nepoznatog parametra
    1) P{teta - landa 1 < teta^ < teta + landa2}
    2) P{teta - landa 1 < teta1^ < teta + landa2}
  • Ako je verovatnoca 1 uvek veca od verovatnoce 2 i to za svako landa1,landa 2, onda je statistika teta bolja ocena od statistika teta1.
  • Varijansa statistike koja predstavlja nepristrasnu ocenu zove se srednja kvadratna greska ocene
  • Najbolja nepristrasna ocena nepoznatog parametra bice ona cija varijansa ima minimalnu vrednost u odnosu na sve ostale nepristransne ocene, tj: Var(teta^) <= Var(tetai^);
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q
  1. Efikasne ocene?
A
  • Kako je za parametar teta populacije potrebano naci ocenu teta^ koja ce biti bolja ako je njena varijansa manja, izraz E(teta^ - teta)^2 tj. srednja kvadratna greska ocene parametra se moze smatrati merom efikasnosti te ocene.
  • Sto je ta vrednost bliza 0, to je ocena efikasnije.
  • Efikasnost ocene teta^ parametra teta je kolicnik minimalne srednje kvadratne greske i srednje kvadratne greske ocene teta^: Ef(teta^) = E(teta0^ - teta)^2/E(teta^ - teta)^2; gde je teta0^ ocena koja ima najmanju srednju kvr gresku
  • Za nepristrasne ocene, efikasnos ocene teta^ je kolicnik varijansi Ef(teta^) = Var(teta0^)/Var(teta^)
  • Efikasnost ocene je broj koji ispunjava uslov: 0 <= Ef(teta^) <= 1 ( ako je jednako 1, ocena je efikasna)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q
  1. Optimalne ocene?
A
  • Najbolje nepristrasna ocena nepoznatog parametra bice ona cija varijansa ima minamlanu vrednost u odnosu na sve ostale nepristrasne ocene tj. Var(teta^) <= Var(teta i^)
  • Nepristranse ocena sa minimalnom varijasnom predstavlja optimalnu ocemu parametra teta u klasi nepristrasnih ocena.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q
  1. Metod maksimalne verodostojnsoti?
A
  • Funkcija verodostojnosti za uzorak (x1..xn): L(x1…xn,teta1…tetaK) = P f(xi,teta1…tetak)
  • Metod maksimalne verodostojnosti je metod izbora vrednosti parametra modela tako da gunkcije verodostojnosti ima sto vecu vrednost.
  • Kako je funkcija logL monotono rastuca, ona ima maksimum za iste vrednosti parametara kao i gunk L; Logaritmovanjem se proizvod transformise u zbir, a tacka u kojoj logL(alfa) dostize maksimum predstavlja resenje sisitema jadnacina.
  • Statistika koje se dobija kao resenje sistepa po nepoznatim parametirma teeta1,… tetaK su ocene maksimalne verodostojnosi za nepoznati parametar.
  • Efikasnos ocene - ako postoji efikasna ocena parametra teta tada jednacina verodostojnosti ima jedinstveno resenje i to je vas ocena teta^.
  • Princip invarijantnosti - Ako je teta^ ocena maks verodostojnosti parametra teta, tada je g(teta^) ocena maks verodostojnosti funkcije g(teta)
  • Jednoznacnost resenja - Jednacina verodostojnosti ne mora uvek da ima samo jedno resenje.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q
  1. Intervali poverenja i opsti postupak odredjivanja intervala poverenja?
A
  • Intervali formirani u skladu sa pravilima izvedenim iz TB i statistike predstavljaju intervale povernja za nepoznate parametre populacije, a granice intervala se odredjuju preko uzorka x1…xn
  • Na osnovu prostog slucajnog uzorka x1…xn odredjuju se dve statistike: Z1 i Z2
  • P{Z1< teta <= Z2} = gama
  • P{teta ne pripada [z1,z2]} = 1 - gama
  • Verovatnoca gama je nivo poverenja a interval [z1,z2] interval poverenja.
    1. Odredjuje se funk uzorka i parametra teta g za koju vazi da je definisana za svaku vrednost teta, da je neprekidna i monotona i da rasoodela funk g ne zavisi od nepoznatog paranetra teta; njen zakon verovatnoca je funk Fi(y)
    2. Za dat nivo poverenja gama odredjuju se dve vrednosti g1 i g2 ( integral ), vrednost g1 i g2 su takve da je za svaku sl prom Y koja ima zakon vrv Fi (y) vrv da se Y nadju u intervalu (g1,g2) jednaka gama.
    3. Resenje nejednacin:
    g(x1…xn;teta) <= g2
    g(x1…xn;teta) > g1
    z1 < teta <= z2
    4. Posto statistika g ima zakon vrv dat funk Fi(y), vrv dogadjaja g1 < g(x1…xn;teta) <= g2 bice jednaka gama.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q
  1. Interval poverenja za ocekivanu vrednost?
A
  • Interval poverenja za srednju vrednost m kada se zna sigma^2 a uzorak iz populacije N(m,sigma^2): Z=Xvar - m/sigma/koren(n)
    Fi(Z0) = 1+beta/2
    Im = [Xvar - Z0sigma/koren(N);Xvar + Z0sigma/koren(N)]
  • Interval poverenja za m kada se ne zna sigma^2:
    Tau = Xvar - m/S/koren(n-1)
    Fn-1(to) = 1+beta/2
    Im = [Xvar - toS/koren(n-1);Xvar + toS/koren(n-1)]
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q
  1. Jednostrani i dvostrani intreval poverenja za varijansu?
A
  • Jednostrani: Tau = nS^2/sigma^2
    Fn-1(Hi0^2) = 1-beta
    Isigma^2 = [ 0;nS^2/Hio^2]
  • Dvostrani: Tau = nS^2/sigma^2
    Fn-1(Hi1^2) = 1-beta / 2
    Fn-1(Hi2^2) = 1+beta / 2

Isigma^2 = [ nS^2/Hi2^2;nS^2/Hi1^2]

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q
  1. Interval poverenja za razliku matematickih ocekivanja?
A
  • Poznate sigma1^2 i sigma2^2 X1: N(m1,sigma1^2/n1), X2: N(m2,sigma2^2/n2)
    Tau = X1var - X2var - ( m1 - m2)/ koren(sigma1^2/n1 + sigma2^2 / n2)
    Fi(Zo) = 1 + beta / 2;
    I(m1-m2) = [X1var - X2var - Zokoren(sigma1^2/n1 + sigma2^2 / n2);X1var - X2var + Zokoren(sigma1^2/n1 + sigma2^2 / n2)]
    -Nepoznate sigma1^2 i sigma2^2:
    Tau = X1var - X2var - ( m1 - m2)/ koren(n1s1^2 + n2S2^2) * koren(n1n2/n1+n2 * n1+n2-2)
    Fn1+n2-2 (to) = 1 + beta / 2;
    I(m1-m2) = [X1var - X2var - to* koren(n1S1^2 + n2S2^2)/koren(n1n2/n1+n2(n1+n2-2);X1var - X2var + to* koren(n1S1^2 + n2S2^2)/koren(n1n2/n1+n2(n1+n2-2)]
17
Q
  1. Interval poverenja za nepoznatu verovatnocu?
A

W - statistika koje predstavlha broj ponavljanja dogadjaja A, cija se verovatnoca ocenjuje u uzorku obima n;
Z* = W* = W - np/koren(np(1-p);
Fi(Zo) = 1 + beta/2
p{|Z*| < Zo} = beta;
p{(w-np)^2 < Zo^2 * np(1-p)} = beta;
p{p^2(n^2 + nZo^2) - p(2Wn +nZo^2) + W^2 < 0} = beta;
Ip[p1^;p2^]

18
Q
  1. Interval poverenja za koeficijent korelacije?
A
  • Dabi odredili interval poverenja za RO koristicemo uzorak (x1,y1)…(xn,yn) i uzoracki koeficijent korelacije:
    r = Sxy/SxSy = 1/n suma( xi - xvar)(yi - yvar)/ koren(1/n suma( xi - xvar)^2(yi - yvar)^2 koji predstavlja ocenu koeficijenta korelacije u populaciji; Z = 1/2ln 1+r/1-r
  • Standardizacijom statistike Z dobija se statistika koja ima standardizovanu normalnu raspodelu Fi(Zo) = 1 + beta / 2;
    Iro = [e^2Z1 - 1 / e^2Z1 + 1;e^2Z2 - 1 / e^2Z2 + 1]
19
Q
  1. Testiranje hipoteze, greske I i II vrste?
A
  • Statisticko testiranje hipoteze - teorija utvrdjivanja kriterijuma donosenja odluke na osnovu statistickih podataka i primenom metoda stat analize.
  • Ho - nulta hipoteza; H1 - Alternativna hipoteza
  • Testiranje hipoteze - postupak za proveru hipoteze na osnovu uzorka.
  • Postoje 2 vrste testova:
    1. Parametarski testovi - hipoteze se odnose na odredjene parametre populacije, na osnovu osobina raspodele populacije donosimo zakljucke o osobinama uzorka izvucenih iz te populacije, poredimo zakljucke i donosimo odluku o prihvatanju il odbacivanju hipoteze.
    2. Neparametarski testovi - oni se najcesce odnose na raspodelu koju obelezje ima odnosno nema . sto je potrebno zakljuciti na osnovu uzorka.
  • Prosta hipoteza je ona koje se odnosi na samo jednu mogucu vrednot parametara il jednu tacno odredjenu raspodelu.
  • Moguce greske:
    1) Greska prvog tipa - ako odbacimo Ho a ona je tacna
    2)Greska drugog tipa - ako prihvatimo Ho a ona je netacna
  • Skup vrednosti Rn :
    1. Podskup C - kriticna oblast
    2. Podskup Rn-C
  • Greska I vrste: alfa - nivo znacajnosti
    Kada je Ho tacna, rezultati uzorka mogu pripasti C il ne
    alfa = P{(x1…xn) pripada C|Ho} - ako pripadnu donosimo pogresan zakljucak
    1 - alfa = P{(x1…xn) ne pripada C|Ho} - ako pripadnu Rn-C necemo doneti pogresan zakljucak
  • Greska II vrste: beta
    beta = P{(x1…xn) ne pripada C|Ho} - vrv pogresnog zakljucivanja
    1 - beta = P{(x1…xn) pripada C|Ho} - vrv tacnog zakljucivanja
20
Q
  1. Parametarski testovi, proste i slozene hipoteze?
A
  • Postupak pri odredjivanju:
    1. Definise se statistika Tau = f(x1…xn) na uzorku cija je raspodela koncentrisana oko vrednosti Teta0 kada je tacnaHo a oko vrednosti Teta1 kada je tacna H1
    2. Moguce vrednosti statistike Tau se dela na dva dela izborom broja Zo koji ce biti izmedju Teta0 i Teta1
    3. Kriticna vrednost Zo odredjuje se tako da vrv dogadjaja Tau > Zo pod uslovom da je Teta = Teta0 bude jedanko alfa: P(Tau > Zo| Teta = Teta0) = alfa;
    4. Smanjenjem jedne greske dolazi do povecanja druge zato se alga unapred odredjuje
    5. Odluka o prihvatanju il odbacivanju Ho:
  • Ako je Tau < Zo usvaja se Ho
  • Ako je Tau > Zo odbacuje se Ho
  • Proste hipoteze se odnose na jednu mogucu vrednost parametra ili na jednu tacno odredjenu raspodelu
  • Slozene hipoteze proveravaju vise razlicitih slucajeva.
21
Q
  1. Testiranje hipoteze o matematickom ocekivanju?
A
  • Pretpostavimo da je uzorak x1,…,xn iz populacije sa normalnom raspodelom, da je ocekivana vrednost m nepoznata i testirajmo hipotezu da m ima odredjenu vrednost m0
    Ho(m = mo) Tau = Xvar - m / sigma/ koren(n)
  • sigma ^2 poznata:
    Ho( m = mo); H1(m > mo) ( graf je srafiran desno)
    Ho( m = mo); H1(m < mo) ( graf je srafiran levo)
    Ho( m = mo); H1(m != mo) ( graf je srafiran s obe strane)
  • sigma^2 nepoznata
    Tau = Xvar - m/s/koren(n-1)
22
Q
  1. Testiranje hipoteza o jednakosti matematickih ocekivanja?
A
  • Ho(m1 = m2)
    H1 (m1 > m2) - desnostrana
    H1 (m1 < m2) - levostrana
    H1 (m1 != m2) - obostrana
  • sigma^2 poznata:
    *sigma1^2 != sigma2^2: Tau = (X1var - X2var) - (m1-m2)/koren(sigma1^2/n1 + sigma2^2 / n2)
    *sigma1^2 = sigma2^2 = sigma^2: Tau = (X1var - X2var) - (m1-m2)/ sigma * koren(n1n2/n1+n2)
  • sigma^2 nepoznata:
    *mali uzorak: ( < 30)
    Tau = (X1var - X2var) - (m1-m2)/koren(n1S1^2 + n2S2^2 * koren(n1n2 / n1+n2 * (n1+n2-2)
    *veliki uzorak: ( > 30)
    Tau = (X1var - X2var) - (m1-m2)/koren(S1^2/n1 + S2^2/n2)
23
Q
  1. Testiranje hipoteze o varijanis?
A
  • Hi kvadrat test
    Ho(sigma^2 = sigma0^2)
    H1(sigma^2 > sigma0^2):
    Tau = nS^2 / sigma^2
  • Ako hipoteza Ho nije tacna, odnostno ako je tacna alternativna hipoteza H1 sigma^2 > sigma0^2 onda je:
    Tau - nS^2 / sigma0 ^2, pa ce njena ocekivana vrednost biti veca od (n-1) jer je sigma^2 / sigma0^2 > 1
  • Ako je H0 tacna , statistika Tau = nS^2 / sigma0^2 ima Hi kvadratnu raspodelu pa je verovatnoca : P{Tau > Xo|sigma^2 = sigma0^2} = alfa
24
Q
  1. Testiranje hipoteze o kolicniku varijanse?
A
  • Iz populacije sa normalnom rasopdelom uzimaju se 2 uzorka:
    x1…xn1
    x1…xn2
    i odredjuju se varijanse i kolicnik varijansi S1^2/S2^2
  • Potrebno je proveriti da li su te razlike slucajne, odnosno proveriti hipotezu Ho(sigma1^2 = sigma2^2)
  • Odluka o prihvatanju ili odbacivanju H0 donosimo koristeci F-test: F = sigma2^2/ sigma1^2 * n1(n2-1)S1^2/n2(n1 - 1)S2^2
  • Kad je Ho tacna, statistikaF = n1(n2-1)S1^2/n2(n1 - 1)S2^2
    ima F raspodelu sa (n1 - 1) i (n2 - 1) stepeni slobode ap je verovatnoca P{Tau > Fo | sigma1^2 = sigma 2^2} = alfa
25
Q
  1. Testiranje hipoteze o verovatnoci?
A
  • Ho ( p = p0)

H1 ( p >, Zo |p = p0} = alfa