STAT USMENI Flashcards
1
Q
- Frekvencije i graficko predstavljanje raspodela frekvencija
A
- X je obelezje koje najednom elementu stat skupa uzima jednu vredost iz {x1,…,xn}
- Kada se utvrdi koliko elemenata stat skupa moze uzeti vrednost xi, dobija se raspodela apsolutnih frekvencija.
- Ako je X neprekidnog tipa i ako uzima vrednosti iz intervala (a,b), podelom na k podintervale, pri cemu je a0 = a, ak = b, nazvacemo grupnim intervalom
- Za svaki grupni interval i za svaku vrednost obelezja x odredimo relativnu frekvenciju pi = fi / n
- Realtivne frekvencije su brojevi koji zadovoljavaju uslov:
pi >= 0;
suma pi = 1; - Iz raspodele apsolutnih frekvencija vrednost kumulativne funkcije dobija se kada se sve prethodne saberu. ci = f1+f2…
- Realtivne kumulativne funkcije Fi dobijaju se deljenjem kumulativne frekvecnije ci sa brojem elemenata Fi = ci / n
- Na X osi se nalaze elementi x, na Y osi se nalaze vrednosti frekvencija, konstruisu se pravougaonici iznad grupnih intervala koji imaju visinu frekvencije.
- Histogram sluzi za prikazivanje raspodela relativnih frekvencija gde ce pravougaonici imati povrsinu jednaku vrednsotima relativnih frekvencija.
2
Q
- Mere centralne tendencije?
A
- Aritmeticka sredina niza brojeva je broj koje se dobija kada se njihov zbir podeli sa ukupnim brojem clanova tog niza. X(nadvuceno) = 1/n suma xi;
- Ako je obelezje X neprekidnog tipa uzimaju se sredine intervala
- Ako su sve vrednosti na skupu jednake onda je aritmeticka sredina jednaka tom broju
- Xvar > x - gde je x najmanja vrednost
- Xvar < x’ - gde je x’ najveca vrednost
- Geometrijska sredina niza brojeva je n-ti koren iz proizvoda njegovih clanova. G = n-ti koren(x1*x2…)
- Sve vrednosti moraju biti pozitivne.
- Harmonijska sredina niza brojeva je reciprocna vrednost aritmeticke sredine reciprocnih vrednosti clanova tog niza:
1/H = 1/N suma 1/xi - Modus je ona vrednost koja ima najvecu frekvenciju u posmatranom stat skupu ili ona vrednost u cijoj se okolini najcesce ponavljaju izmerene vrednosti na stat skupu.
- Medijana je ona vrednost X koja deli stat skup na dva jednaka dela
3
Q
- Mere varijabiliteta?
A
- Sto je manje varijabiliteta toliko je srednja vrednost dobar pokazatelj obelezja.
- Razmak varijacije - razlika izmedju najvece i najmanje vrednosti na X: R = Xmax - Xmin
- Kvartilna devijacija - Q = X0,75 - X0,25 / 2
- Srednja devijacija - je aritmeticka sredina apsolutnih vrednosti odstupanja X od njegove aritmeticke sredine Xvar na stat skupu: em = 1/N suma |Xi - Xvar|;
- Varijansa je aritmeticka sredina kvadrata odstupanja vrednosti X od njegove aritmeticke sredine : S2 = 1/N suma Xi2 - Xvar2
- Standardna devijacije je pozitivan koren varijanse: S = + koren S2;
- Koeficijent varijacije je procentualno izrazen odnos standardne devijacije i aritmeticke sredine X: V = S/Xvar *100%;
4
Q
- Momenti stat obelezja?
A
- Obican momenat reda k je matematicko ocekivanje k-tog stepena X: mk= E(Xk) (prekidno *pi, neprekidno integral)
- Centralni momenat reda k je ocekivana vrednsot k-tog stepena razlike X i ocekivane vrednosti m obelezja X:
miK = E(X-m)k (prekidno *pi, neprekidno integral) - Veza izmedju centralnih i obicnih momenata:
(x-m)^k = suma (-1)^k-1(k nad i)m^k - i X^i
5
Q
- Pirsonovi koeficijenti?
A
- Prvi Pirsonov koeficijent (asimetrije)
beta1 = mi3 / S3 = 1/Nsuma xi^3 - m^3
beta = 0 - raspodela je simetricna
beta > 0 - raspodela je asimetricna u levo
beta < 0 - raspodela je asimetricna u desno - Drugi Pirsonov koeficijent(spljostenosti)
beta2 = mi4 / S4 = 1/N suma Xi^4 - m^4
beta2 = 3 - normalna spljostenost
beta2 > 3 - spljostenost veca od normalne
beta2 < 3 - spljostenost manja od normalne
6
Q
- Populacija, uzorak, statistike, verodostojnost uzorka?
A
- Statisticki skup je populacija, a podskup uzorak.
- Skup raspolozivih podataka je uzorak, a pojava za koju se posmatraju je populacija
- Prost slucajni uzorak - verovatnoca izbora jednog elementa u uzorku ne zavisi od verovatnoca ostalih elemenata
- Sistematski uzorak - na slucajna nacin se bira prvi element, a zati se iz populacije uzima svaki k-ti element
- Stratifikovan uzorak 0 . ako je populacija podeljenja na stratume, iz svakog se uzima odgovarajuci broj elemenata.
- Prost slucajni uzorak - rezultat n nezavisnih ponavljanja eksperimenta bice skup slucajnih promenljivih x1…xn koje su medjusobno nezavisni i sve imaju istu raspodelu kao i X.
- Verodostojnost uzorka:
- Prekidnog tipa - f(x1…xn) = Pp(Xi) - funkcija f(x1…xn) je funk verodostojnosti uzorka
- Neprekidnog tipa - f(x1…xn) = Pf(Xi)
- Uzorak (x1…xn) je slicajna promenljiva i svaka funkcija tog uzorka je takodje slucajna promenljiva i takva funkcija predstavlja parametar uzorka i zove se statistika. Z = f(x1…xn)
- Raspodelu tj zakon verovatnoce statistike Z odredjujemo na osnovu funkcije verodostojnisti uzorka
- Da bi se odredila raspodela, potrebno je odrediti ksup svih mogucih vrednosti, a zatim verovatnoce tih vrednosti.
7
Q
- Sredina uzorka, varijansa uzorka?
A
- Aritmeticka sredina uzorka/ Sredina uzorka je statistika data funkcijom Xvar = 1/N suma Xi
- Za dovoljno velike uzorke mozemo reci da ce se sredine uzorka i populacije malo razlikovati.
- Kod vecih uzoraka varijansa je manja i tezi 0 kad n tezi beskonacno, tj. verovatnoca da ce se Xvar naci u maloj okolini broja m tezi 1.
- Ako pretpostavimo da X ima normalnu raspodelu, tj N(m,sigma^2), to ce znaciti da ce sredina uzorka imati normalnu rapodelu N(m; sigma^2/n)
- Statistika Z = Xvar - m / sigma * koren(n) ima standardizovanu sredinu uzorka koji ima standardizovanu normalnu rapspodelu.
- Centralna granicna teorema: Ako je m ocekivana vrednost a varijansa sigma^2 tada raspodela sredine Xvar uzorka tezi normalnoj raspodeli sa ocekivanjem m i varijansom sigma^2/N kad n neograniceno raste.
- Nek su Xvar i S^2 sredina i varijansa uzorka iz populacije sa normalnom raspodelom:
1. Xvar i S^2 su medjusobno nezavisne
2. Sredina uzorka ima normalnu raspodelu
3. Statistika nS^2/sigma^2: Xi^2 n - 1;
8
Q
- Tackaste ocene, nepristrasne ocene parametra?
A
- Ocena parametra populacije je statistika definisana na uzorku i predstavalja tackastu ocenu nepoznatog parametra.
- Vazan je izbor funkcije f jer od nje i zavisi u kojoj meri je data ocena nepoznatog parametra dobra.
- Ocekivana vrednost statistike f(x1…xn) kojom se ocenjuje nepoznati parametar teta^ pozeljno je da bude bas teta.
Ako je ovaj uslov ispunjen onda je teta^ = f(x1…xn) nepristrasna ocena nepoznatog parametra.
E(teta^) > teta - pozitivno pristrasna
E(teta^) < teta - negativno pristrasna - Nepristrasna ocena obezbedjuje da na osnovu veceg uzorka iz iste populacije u proseku tacno odredimo vrednost nepoznatog parametra.
9
Q
- Ocene sa minimalno varijansom?
A
- Ocena teta^ parametra teta bice dobra ako je blizu prave vrednosti tog parametra, pa je potrebno odrediti meru bliskosti ocene i nepoznatog parametra
1) P{teta - landa 1 < teta^ < teta + landa2}
2) P{teta - landa 1 < teta1^ < teta + landa2} - Ako je verovatnoca 1 uvek veca od verovatnoce 2 i to za svako landa1,landa 2, onda je statistika teta bolja ocena od statistika teta1.
- Varijansa statistike koja predstavlja nepristrasnu ocenu zove se srednja kvadratna greska ocene
- Najbolja nepristrasna ocena nepoznatog parametra bice ona cija varijansa ima minimalnu vrednost u odnosu na sve ostale nepristransne ocene, tj: Var(teta^) <= Var(tetai^);
10
Q
- Efikasne ocene?
A
- Kako je za parametar teta populacije potrebano naci ocenu teta^ koja ce biti bolja ako je njena varijansa manja, izraz E(teta^ - teta)^2 tj. srednja kvadratna greska ocene parametra se moze smatrati merom efikasnosti te ocene.
- Sto je ta vrednost bliza 0, to je ocena efikasnije.
- Efikasnost ocene teta^ parametra teta je kolicnik minimalne srednje kvadratne greske i srednje kvadratne greske ocene teta^: Ef(teta^) = E(teta0^ - teta)^2/E(teta^ - teta)^2; gde je teta0^ ocena koja ima najmanju srednju kvr gresku
- Za nepristrasne ocene, efikasnos ocene teta^ je kolicnik varijansi Ef(teta^) = Var(teta0^)/Var(teta^)
- Efikasnost ocene je broj koji ispunjava uslov: 0 <= Ef(teta^) <= 1 ( ako je jednako 1, ocena je efikasna)
11
Q
- Optimalne ocene?
A
- Najbolje nepristrasna ocena nepoznatog parametra bice ona cija varijansa ima minamlanu vrednost u odnosu na sve ostale nepristrasne ocene tj. Var(teta^) <= Var(teta i^)
- Nepristranse ocena sa minimalnom varijasnom predstavlja optimalnu ocemu parametra teta u klasi nepristrasnih ocena.
12
Q
- Metod maksimalne verodostojnsoti?
A
- Funkcija verodostojnosti za uzorak (x1..xn): L(x1…xn,teta1…tetaK) = P f(xi,teta1…tetak)
- Metod maksimalne verodostojnosti je metod izbora vrednosti parametra modela tako da gunkcije verodostojnosti ima sto vecu vrednost.
- Kako je funkcija logL monotono rastuca, ona ima maksimum za iste vrednosti parametara kao i gunk L; Logaritmovanjem se proizvod transformise u zbir, a tacka u kojoj logL(alfa) dostize maksimum predstavlja resenje sisitema jadnacina.
- Statistika koje se dobija kao resenje sistepa po nepoznatim parametirma teeta1,… tetaK su ocene maksimalne verodostojnosi za nepoznati parametar.
- Efikasnos ocene - ako postoji efikasna ocena parametra teta tada jednacina verodostojnosti ima jedinstveno resenje i to je vas ocena teta^.
- Princip invarijantnosti - Ako je teta^ ocena maks verodostojnosti parametra teta, tada je g(teta^) ocena maks verodostojnosti funkcije g(teta)
- Jednoznacnost resenja - Jednacina verodostojnosti ne mora uvek da ima samo jedno resenje.
13
Q
- Intervali poverenja i opsti postupak odredjivanja intervala poverenja?
A
- Intervali formirani u skladu sa pravilima izvedenim iz TB i statistike predstavljaju intervale povernja za nepoznate parametre populacije, a granice intervala se odredjuju preko uzorka x1…xn
- Na osnovu prostog slucajnog uzorka x1…xn odredjuju se dve statistike: Z1 i Z2
- P{Z1< teta <= Z2} = gama
- P{teta ne pripada [z1,z2]} = 1 - gama
- Verovatnoca gama je nivo poverenja a interval [z1,z2] interval poverenja.
1. Odredjuje se funk uzorka i parametra teta g za koju vazi da je definisana za svaku vrednost teta, da je neprekidna i monotona i da rasoodela funk g ne zavisi od nepoznatog paranetra teta; njen zakon verovatnoca je funk Fi(y)
2. Za dat nivo poverenja gama odredjuju se dve vrednosti g1 i g2 ( integral ), vrednost g1 i g2 su takve da je za svaku sl prom Y koja ima zakon vrv Fi (y) vrv da se Y nadju u intervalu (g1,g2) jednaka gama.
3. Resenje nejednacin:
g(x1…xn;teta) <= g2
g(x1…xn;teta) > g1
z1 < teta <= z2
4. Posto statistika g ima zakon vrv dat funk Fi(y), vrv dogadjaja g1 < g(x1…xn;teta) <= g2 bice jednaka gama.
14
Q
- Interval poverenja za ocekivanu vrednost?
A
- Interval poverenja za srednju vrednost m kada se zna sigma^2 a uzorak iz populacije N(m,sigma^2): Z=Xvar - m/sigma/koren(n)
Fi(Z0) = 1+beta/2
Im = [Xvar - Z0sigma/koren(N);Xvar + Z0sigma/koren(N)] - Interval poverenja za m kada se ne zna sigma^2:
Tau = Xvar - m/S/koren(n-1)
Fn-1(to) = 1+beta/2
Im = [Xvar - toS/koren(n-1);Xvar + toS/koren(n-1)]
15
Q
- Jednostrani i dvostrani intreval poverenja za varijansu?
A
- Jednostrani: Tau = nS^2/sigma^2
Fn-1(Hi0^2) = 1-beta
Isigma^2 = [ 0;nS^2/Hio^2] - Dvostrani: Tau = nS^2/sigma^2
Fn-1(Hi1^2) = 1-beta / 2
Fn-1(Hi2^2) = 1+beta / 2
Isigma^2 = [ nS^2/Hi2^2;nS^2/Hi1^2]