15. Becslés II.: Rétegzett mintavételi eljárások, becslés alapfogalmai, statisztikai becslés rétegzett minta alapján Flashcards
Rétegzett mintavétel (R)
Rétegzett mintavétel (R): Heterogén sokaság esetén alkalmazható eljárás. Először a fősokaságot valamilyen ismérv szerint átfedés-mentesen homogén rétegekre osztjuk fel. Ezután az egyes rétegeken belül egymástól függetlenül egyszerű véletlen mintát veszünk. Azért célszerű ennek a mintavételi módnak az alkalmazása, mert azonos mintanagyság esetén a vizsgált jellemzőkre kisebb hibát kapunk, mint az Egyszerű véletlen mintavétellel, feltéve hogy a rétegzés jó volt.
- egyenletes rétegzés/eloszlás: minden rétegből ugyanakkora mintát veszünk
- arányos rétegzés/eloszlás: jól reprezentálja a teljes sokaságot, sokkal kisebb a rétegzés hibája
- Neyman-féle optimális rétegzés: nagyobb rétegből, nagyobb mintát vesz. A változékonyabb, heterogénebb rétegekből szintén nagyobb mintát vesz.
- Költség-optimális rétegzés: adott költségkeret mellett minimális hibát eredményez. Az egyes rétegek szórása mellett ismerjük és a kiválasztásánál figyelembe vesszük az egyes rétegek megfigyelésének költségeit is.
A statisztikai becslés alapfogalmai
A statisztikai becslés alapfogalmai:
Paraméter: A sokaság valamely jellemzője pl.: várható érték, arány, szórás (sokasági variancia)
Becslőfüggvény: olyan függvény, mely alkalmas a sokasági paraméter értékének mintából történő meghatározására.
Standard hiba: a becslő függvény valamennyi lehetséges mintából számított értékeinek a szórása.
o Nem mintavételi hiba: lefedési hiba, feldolgozási hiba, nem megfelelő adatszolgáltatás.
o Mintavételi hiba: a sokaság minden egységéről való lemondás ára, nagysága matematikai eszközökkel becsülhető. A mintavételi hiba függ:
- az alapsokaság eloszlásától,
- az alkalmazott mintavételi eljárástól
- a vizsgált mutatószám fajtájától
- a minta nagyságától
Pontbecslés: a becslőfüggvény mintából számított konkrét értéke
Intervallumbecslés: adott π megbízhatósági szinthez tartozó intervallum alsó és felső határának meghatározása.
Konfidencia intervallum (megbízhatósági tartomány).
Adott π valószínűséget megbízhatósági szintnek nevezzük, ami pl π=0,95% esetében azt jelenti, hogy azonos feltételek mellett sokszor megismételt mintavétel esetén 100 mintából átlag 95 esetében a konfidencia intervallum közrefogja a várható értéket, 5 eset pedig kedvezőtlen eredménnyel jár.