14. Becslés I.: Sokaság és minta fogalma, a mintából történő következtetés módszerei, a statisztikai becslés alapfogalmai, módszerei egyszerű véletlen minta esetén Flashcards
Sokaság
A statisztikai sokaság a statisztikai megfigyelés tárgyát képező egyedek összessége.
A sokaság egységei: a sokaságot alkotó egyedek.
Minta
Valamely valószínűségi változóra vonatkozó véges számú független kísérlet vagy megfigyelés eredménye. A
mintát a sokaságból azért választjuk ki, hogy a sokaságnak valamely tulajdonságára következtethessünk
belőlük.
Becslés
A statisztikai becslés a mintából történő következtetés egyik formája, amelynek célja az
ismeretlen paraméter értékének közelítő meghatározása. Ennek eszköze a mintából származó
megfigyelések valamely függvénye, a becslő függvény. A becslő függvény értéke mintáról mintára
ingadozik. Egy konkrét mintából kapott (realizált) értéket pontbecslésnek, röviden becslésnek
nevezzük.
Hipotézisvizsgálat
A sokaságra vonatkozó valamely állítás helyességét ellenőrzi.
A statisztikai becslés alapfogalmai
Paraméter: A sokaság valamely jellemzője pl.: várható érték, arány, szórás (sokasági variancia)
Becslőfüggvény: olyan függvény, mely alkalmas a sokasági paraméter értékének mintából történő meghatározására.
Standard hiba: a becslő függvény valamennyi lehetséges mintából számított értékeinek a szórása.
o Nem mintavételi hiba: lefedési hiba, feldolgozási hiba, nem megfelelő adatszolgáltatás.
o Mintavételi hiba: a sokaság minden egységéről való lemondás ára, nagysága matematikai eszközökkel becsülhető. A mintavételi hiba függ:
- az alapsokaság eloszlásától,
- az alkalmazott mintavételi eljárástól
- a vizsgált mutatószám fajtájától
- a minta nagyságától
Pontbecslés: a becslőfüggvény mintából számított konkrét értéke.
Intervallumbecslés: adott π megbízhatósági szinthez tartozó intervallum alsó és felső határának meghatározása.
Konfidencia intervallum (megbízhatósági tartomány). Konfidencia intervallumnak nevezzük.
Adott π valószínűséget megbízhatósági szintnek nevezzük, ami pl π=0,95% esetében azt jelenti, hogy azonos feltételek mellett sokszor megismételt mintavétel esetén 100 mintából átlag 95 esetében a konfidencia intervallum közrefogja a várható értéket, 5 eset pedig kedvezőtlen eredménnyel jár.
Becslési kritériumok, függvény tulajdonságai
- Torzítatlanság: Torzítatlannak nevezünk egy becslőfüggvényt akkor, ha a vele kapott becslések értéke (minden lehetséges minta átlagát figyelembe véve) megegyezik a becsülni kívánt sokasági jellemzővel. A torzítatlan becslőfüggvényeket preferáljuk. A torzítatlanság abszolút kritérium, hiszen
már egyetlen becslőfüggvényről is eldönthető, hogy torzítatlan vagy sem. - Aszimptotikusan torzítatlan : Akkor van, ha a mintanagysággal a végtelenbe tartva a torzítás eltűnik
- Konzisztens: A mintanagyság növelésével a becslés nagy valószínűséggel a paraméter felé tart. A megfigyelések számának növelésével a paraméter körüli ingadozás, a variancia csökken.
- Hatásosság (Minél kisebb variancia): A minimális varianca két vagy több becslőfüggvény összehasonlítására szolgál, egyetlen függvényre nem használható.
A statisztikai becslés módszerei egyszerű véletlen minta esetén
- Várható érték becslése
Becslőfüggvény:
A konfidencia intervallum meghatározása függ:
- az x változó alapsokasági eloszlásától
- ismert-e a sokaság szórása
- a minta nagyságától
Alapesetek: μ=¿ ´x+Δ´x
a) a sokaság eloszlása normális, ismert a sokasági szórás, mintanagyság tetszőleges
μ=¿ ´x ± z π∗σ ´x
b) sokaság eloszlása nem ismert, nem ismert a sokasági szórás, csak nagy minta
μ=¿ ´x ±t π∗s´x
c) nem ismert a sokasági szórás, n < 100, csak ha a sokaság eloszlása normális
μ=¿ ´x ±t π∗s´x
Ahol:
- ´x : a becslőfüggvény mintából számított konkrét értéke
- zπ
: standard normális eloszlású valószínűségi változó
- σ ´x
: a mintaátlag standard hibája (a mintaátlagok szórása)t
π
: n-1 szabadságfokú Student-eloszlású valószínűségi változó
A várható érték standard hibája:
Központi határeloszlás tétel: Független valószínűségi változók eloszlása akkor is közelítőleg
normális eloszlást követ, ha a változók nem normális eloszlásúak, feltéve, hogy a minta-elemszám
elég nagy.
- Valószínűség vagy arány becslése
Becslőfüggvény: mintabeli relatív gyakoriság p=k /n
A relatív gyakoriság valószínűségi-eloszlása a binomiális típusból származtatható. Nagy mintából
számított relatív gyakoriság eloszlása közelítőleg normálisnak tekinthető.
Feltétel: nagy minta
Konfidenciaintervallum - Szórásnégyzet, szórás becslése
Becslőfüggvény: korrigált tapasztalati szórás
Feltétel: normális eloszlású alapsokaság, mintanagyság tetszőleges
A szórásnégyzetre csak akkor adható intervallumbecslés, ha a minta normális eloszlású sokaságból
származik, a mintanagyság tetszőleges, tehát kicsi vagy nagy minta is használható