prvi dio Flashcards
Tipovi uzorka?
Prost slučajan uzorak, Stratifikovan uzorak ,Uzorak skupina, Sistematski uzorak
Funkcija verodostojnost uzorka prekidnog tipa?
proizvod verovatnoća P(Xi)
Funkcija verodostojnost uzorka neprekidnog tipa?
proizvod funkcaija f(Xi)
Kakvu raspodelu ima uzorak izvučen iz populacije sa normalnom raspodelom?
Normalnu
Prost slučajan uzorak je skup od n nezavisnih slučajnih promenljivih koje imaju?
Istu raspodelu i to raspodelu populacije
Parametri osnovnog skupa su?
Konstante
Parametri opšteg skupa su promenljive koje zavise od?
Populacije
Statistika je?
Funkcija definisana na uzorku
Opšti statistički model?
F(Xi,Θi)
Statistika Z ima?
Normalnu raspodelu
Ukoliko posmatramo statistiku kao neku f-ju na uzorku važi sledeće?
Jedna ista statistika ima različite raspodele za različite populacije
Uzorak je?
Podskup statističkog skupa na čijim elementima merimo vrednost obeležja X
Statistički skup je populacija, a uzorak?
izabran podskup na kome se meri vrednost obeležja X je uzorak.
Očekivana vrednost sredine uzorka E(x) je
Jednaka očekivanoj vrednosti populacije X
Ako obeležje X ima normalnu raspodelu tada sredina uzorka izvučenog iz ove populacije ima?
Normalnu raspodelu
Sa povećanjem veličine uzorka, varijansa sredine uzorka ?
tezhi 0
Na osnovu CGT rešavaju se problemi
Određivanje vreovatnoće da će sredina uzorka i sredina populacije razlikovati za manje od
zadatog broja
Određivanje intervala oko sredine uzorka tako da da sa zadatom verovatnoćom tvrdimo da
će poopulacija biti u tom intervalu
Određivanje obima uzorka za koji će se uz zadatu verovatnoću sredina uzorka i sredina
populacije razlikovati za manje od zadatog broja
Na osnovu CGT zaključujemo:
Za dovoljno veliko n sredina uzorka će imati približno normalnu raspodelu
Košijeva teorema
H manje G manje X
Sturgesovo pravilo
k=1+3.3logN
Indeks
Količnik vrednosti obeležja X u trenutku t i vrednosti obeležja u nekom drugom
Lančani indeks
Količnici vrednosti obeležja X u trenutku t i vrednosti obeležja u prethodnom trenutku
merenja t-1
Bazni indeks
Posmatranje promene posmatranog obeležja u vremenskoj seriji u odnosu na jedan
trenutak merenja sa kojim podelimo
Mo
je sredina intervala koja ima najveću frekvenciju
Me
je vrednost obeležja x koji deli uređen statistički skup na dva dela
Svi momenti su nepristrasni a varijansa je
negativno pristrasna
Raspodela asimetrična u desno
nadvuceno x vece Me
Raspodela asimetrična u levo
nadvuceno x manjeMe
Šta je ocena:
Statistika definisana na uzorku
Šta ne predstavlja ocenu:
β
Opšti problem teorije ocenjivanja:
Na osnovu rezultata merenja obeležja X u uzorku, treba oceniti raspodelu obeležja na celoj
populaciji a zatim iz te raspodele ocenjivati I nepoznate parametre populacije
Postupkom statističkog ocenjivanja dobijamo:
Tačkaste ocene
Intervalne ocene
Dobru ocenu karakteriše:
Što manji varijabilitet
Što je obim uzorka veći:
Preciznost ocene je veća
Bićemo sigurni u tačnost zaključka ako nepoznati parameter na populaciji ocenimo:
Intervanlnom ocenom
Poželjne osobine ocene parametra su:
Nepristrasnost (Centriranost)
Saglasnost
Efikasnost
Osobina ocene koja nije poželjna:
Što manja efikasnost
Varijansa uzorka je:
Negativno pristrasna ocena varijanse populacije
Optimalna ocena nepoznatog parametra populacije u klasi nepristrasnih ocena je:
Nepristrasna ocena sa minimalnom varijansom
Srednja kvadratna greška ocene je:
Varijansa statistike koja predstavlja nepristrasnu ocenu
Srednja kvadratna greška ocene je (razlika):
Očekivana vrednost kvadrata razlike između ocene parametra i prave vrednosti parametra
Sa povećanjem uzorka srednja kvadratna greška se:
Smanjuje
Da bi ocena jednog parametra bila bolja od ocene drugog parametra:
Mora imati manju srednju kvadratnu grešku
Nepristrasna ocena je efikasnija od druge ako
ima manju standardnu grešku
Efikasnost ocene nepoznatog parametra populacije je:
Količnik minimalne srednje kvadratne greške i srednje kvadratne greške ocene
Efikasnost ocene se kreće između
0 i 1
Asimptotska efikasnost ocene:
2/PI
Koje metode spadaju u tačkaste ocene:
Metoda maksimalne verodostojnosti
Metoda najmanjih kvadrata
Metoda maksimalne verodostojnosti se koristi za:
Izbor jedne vrednosti parametra modela (kao ocene tih parametara), ali tako da funkcija
verodostojnosti ima što je moguće veću vrednost
Sa povećanjem nivoa poverenja
povećava se dužina intervala poverenja
Sa povećanjem obima uzorka
smanjuje se dužina intervala poverenja
Sturges-ово правило: k= 1+3.3logN.
У циљу одређивања оптималног броја k групних интервала за статистички скуп од N елемената
sta je homoskedasticnost
varijansa je konstantna
za sta se koristi metoda max verodostojnosti
izbor jedne vrednosti parametara modela
kad je minimalna moc testa
m=m0 i 1-alfa=beta i 1-beta=alfa
redosled testova
ks 2 uzorka -> mw/t-test -> ww
testovi koji menjaju t-test
mw,ww,ks za 2
sto je vrednost koef. determinacije bliza A
udeo objasnjenog i ukupnog varijabiliteta prema y je veci
raspodela kod vlrm
n-k-1
stae netacno
rangirani i kvalitativni podaci se rade iskljucivo parametarski
ako izmedju x i y postoji determnisticka linerana veza,
koef determinacije ce imati vrednost 1
indukcija?
dedukcija?
testiranje hipoteza?
…
zamena za x2 test (test saglasnosti)
KS za 1 uzorak
moc testa je najveca u zavinosti od
m>m0 i monotono rastuca
statisticka obelezja mogu biti
kvalitativna i kvantitativna
nepristrasnost ocene
ocekivana vrednost teta bar bude bas teta
odakle se uzima interval pvoerenja
interval u kome se nepoznati parametar populacije nalazi sa odredjenom verovatnocom
problem statistickog zakljucivanja
problem ocenjivanja
problem testiranja hipoteza
prosta hipoteza
hipoteza koja se moze odnositi na samo jednu mogucu vrednost parametra ili samo jednu tacno odredjenu raspodelu
nepristrasna ocena
cija je ocekivana vrednost jednaka bas toj vrednosti paramtra, i toe pozeljna osobina ocene
uzorak potice iz 2dimenzionalne normalne raspodele, pretpostavka o nezavinosti obelezja ekvivalentna je
HO(ro ili (p)=0)
ks test za 1 uzorak spada u testove
testove saglasnosti
efikasnost teta bar ocene teta parametra
kolicnik minimalne srednje kvadratne greske i sredjnje kvadratne greske ocene
x ima normalnu spljostenos, 2. pirsonov koeficijent
je 3
koeficijent varijacije
st dev / aritm sredine * 100
t test je alternativa
man witni
prost slucajni uzorak velicine n je
skup od n nezavisnih slucajnih promenljivih, koje imaju istu raspodelu i ta raspodela je i raspodela populacije
srednje kvadratna greska ocene je
razlika izmedju ocene parametara i prave vrednosti parametra
opt ocena parametra m je
x bar
kod man vitnija nulta je
obe populacije imaju istu raspodelu - oba uzorka iz iste populacije
kod testiranja hipoteze o varijansi
DO najvise interesuje, da l je varijansa veca od neke unapred odredjene vrednosti
prost linearni regeresioni model se sastoji od
jedne zavisne i jedne kontrolisane
normalna raspodela kod koje je ocekivana vrednost populacije 0 a varijanse 1
standardizovana normalna raspodela
iz raspodele apsolutnih frekvencija, kumulativne su
sve freq za prethodnog intervala se saberu
kod KS sa 2 uzorka h0 glasi
2 nezavisna uzorka su izvucena iz iste populacije
CGT
…
h0 ZA test koraka za 1 uzorak je
x1…xn je slucajan
koeficijent determinacije vrednosti od
[0,1]
u testiranju hipoteza za pojedinacne parametre beta,
visestruki regresioni model koristi se stat
studentove raspodele sa n-k-1 ss
paramteraski provera nezavisnosti ss i raspodela
studentova n-2 ss
u prostom LRM, parametri dodeljeni primenom metodde najmanjih kvadrata… imaju
normalnu raspodelu
pokazatelj kvaliteta regresionog modela
koeficijent determinacije
u lrm kao ocena slucajnih odstupanja EPSILONi koriste se
reziduali ei
P bar, ili ocena nepoznate proporcije vrvtnoce P je
nepristrasna ocena
sve sredine su
nepristrasne ocene
sa povecanjem velicine uzorka, n tezi beskonacno
sredina uzorka tezi m
za zadati nivo poverenja, duzina itnervala poverenja za ocekivanu vrednost m je
direktno proporcionalna velicini uzorka
obicni momenti uzorka su
nepristrasne ocene obicnih momenta populacije
ako X na populaciji ima normalnu raspodelu, tad su sredina i varijansa uzorka
nezavisne statistike
sredina uzorka je nepristrasna ocena
ocekivanoj vrednosti populacije
Statisticko testiranje hipoteza
teorija utvrdjivanja kriterijuma donosenja odluka na osnovu statistickih podataka i primenom metoda statisticke analize
paramtersski tesovi
na osnovu osobina populacije donosimo zakljucke o osobinama uzorka izvucenih iz takve raspodele, poredimo rezultate sa zakljuckom i donosimo odluku
testiranje hipoteze
postupak za proveru hipoteze na osnovu uzorka
parametarski se odnosi na
neparametarski se odnosi na
odredjene parametre populacije
raspodelu koje obelezje ima
Slozene hipoteze
proveravaju vise razlcitih slucajeva
H0 je uvek
prosta hipoteza
S na 2 je 0 ako
sve vrednosti u uzorku su iste
sto je pristrasnost veca
to su i razlike vece
sto je srednje kvadratna greska blizu 0
to je ocena efikasnija