13. Mintavételi módok, az egyes eljárások alkalmazásának feltételei, jelentősége Flashcards
Adatszerzési módok
A statisztikai megfigyelés kiterjedhet a statisztikailag vizsgálandó jelenségek vagy folyamatok teljességére, egy-egy kiválasztott egyedére vagy a vizsgálandó jelenségek előre kiválasztott részére. Ennek megfelelően megkülönböztethetünk:
- teljes körű adatfelvételt
- részleges adatfelvételt
A teljes körű statisztikai megfigyelés
A teljes körű statisztikai megfigyelést az jellemzi, hogy a vizsgálandó jelenség, folyamat (sokaság) minden egyes egységét számba veszi. Gyakran igen széleskörű, sok egységet érint, ezért túl költséges, időigényes, nehezen hozzáférhető és ellenőrizhető.
Részleges adatfelvétel
- Kontrollált kísérletek: végtelen sokaságról való informálódás eszköze, arra ad választ, hogy a kísérlet végzője által megtervezett feltétel együttesek milyen eredményre vezetnek.
- Egyéb részleges adatfelvétel (nem reprezentatív megfigyelés): Nincs benne az általánosításra való törekvés, a következtetések kizárólag megfigyelt egyedekre vonatkoznak.
- Reprezentatív megfigyelés: A mintavételből származó minden eredményt a sokaság egészének jellemzésére használják fel, azaz általánosítanak a teljes sokaságra. Reprezentatív a minta, ha tükrözi az alapsokaságot, annak jellemzőit, tulajdonságait, összetételét. Mindig megadható mintavételi hiba, azaz, hogy a mintavétel tényéből mekkora hiba fakadhat.
Véletlenen alapuló kiválasztás: Független azonos eloszlású minta (FAE)
Véletlenen alapuló kiválasztás: érvényesíthető a valószínűség-számítás alapfeltételei.
Független azonos eloszlású minta (FAE): Homogén és végtelen vagy nagyon nagy számosságú sokaságból veszünk mintát visszatevéssel vagy visszatevés nélkül. Hasonló eredményre vezet, ha véges sokaságból egyenlő valószínűséggel visszatevéses mintát veszünk. Gyakorlati alkalmazása elsősorban a tömegtermelés minőségellenőrzésénél célszerű.
Véletlenen alapuló kiválasztás: Egyszerű véletlen mintavétel (EV)
Egyszerű véletlen mintavétel (EV):
A legegyszerűbb véletlen mintavételi mód az, amikor egy
N elemből álló sokaság minden elemének egyenlő esélyt biztosítunk a mintába való bekerülésre. Egyszerű véletlen mintavételt használunk homogén, véges elemszámú sokaság
esetén, amikor a mintát visszatevés nélkül választjuk ki, minden lehetséges n elemű minta kiválasztásának azonos valószínűséget biztosítva. Az egyszerű véletlen minta elkészítéséhez komplett lista, ún. mintavételi keret szükséges; ennek összeállítása az első feladat. A következő lépés a mintanagyság meghatározása, amelyet a pontossági követelmények, a sokaság szóródása, valamint a rendelkezésre álló költségkeret determinálnak.
Véletlenen alapuló kiválasztás: Rétegzett mintavétel (R)
Rétegzett mintavétel (R):
Heterogén sokaság esetén alkalmazható eljárás. Először a fősokaságot valamilyen ismérv szerint átfedés-mentesen homogén rétegekre osztjuk fel. Ezután az egyes rétegeken belül egymástól függetlenül egyszerű véletlen mintát veszünk. Azért célszerű ennek a mintavételi módnak az alkalmazása, mert azonos mintanagyság esetén a vizsgált jellemzőkre kisebb hibát kapunk, mint az Egyszerű véletlen mintavétellel, feltéve, hogy a rétegzés jó volt.
- egyenletes rétegzés/eloszlás: minden rétegből ugyanakkora mintát veszünk
- arányos rétegzés/eloszlás: jól reprezentálja a teljes sokaságot, sokkal kisebb a rétegzés hibája
- Neyman-féle optimális rétegzés: nagyobb rétegből, nagyobb mintát vesz. A változékonyabb, heterogénebb rétegekből szintén nagyobb mintát vesz.
- Költség-optimális rétegzés: adott költségkeret mellett minimális hibát eredményez. Az egyes rétegek szórása mellett ismerjük és a kiválasztásánál figyelembe vesszük az egyes rétegek megfigyelésének költségeit is.
Véletlenen alapuló kiválasztás: Csoportos, egylépcsős mintavétel (CS)
Csoportos, egylépcsős mintavétel (CS): Homogén, véges sokaság esetén alkalmazható, ha nem áll rendelkezésre a sokasági elemek teljes listája, de nagyobb csoportokra rendelkezünk listával. Akkor is alkalmazható, ha a csoportok a koncentráltságuk miatt könnyebben, olcsóbban figyelhetők meg, mint az egyedek. Először a csoportok halmazából EV mintát veszünk, majd az így kiválasztott csoportokat teljes körűen megfigyeljük. (pl. iskolások drogfogyasztási szokásai).
Véletlenen alapuló kiválasztás: Többlépcsős mintavétel (TL)
Többlépcsős mintavétel (TL): Hasonló esetekben használjuk, mint a csoportos mintavételt, itt több lépcsőben jutunk el a végső megfigyelési egységhez. Leggyakoribb a kétlépcsős mintavétel. Először EV mintavétellel kiválasztjuk a csoportokat, majd a csoportokon belül is EV mintavételt végzünk.
Nem véletlenen alapuló kiválasztás
Szisztematikus: ha n elemű mintát akarunk venni egy N elemű sokaságból, akkor meghatározva a k=N/n lépésközt a k0 véletlen kezdőpontból kiindulva minden k-adik elemet figyeljük meg:
ko, k0+k, k0+2k…. A minta gyorsan és mechanikusan kiválasztható. Egybeeshet az EV megfigyeléssel, ha az elemek felsorolása független a megfigyelés tárgyától.
Kvótás: a jól megtervezett kvótás kiválasztás felér egy rétegzett mintavételes eljárással.
Hólabda: rejtett sokaságok feltérképezésére és mintavételezésére alkalmas. Arra épül, hogy ha ismerünk egy elemet, azzal kitöltetjük és visszaküldetjük vele. Adunk neki még néhányat, hogy ha ismer még ilyen egyedeket, akkor adja oda nekik, azok is töltsék ki, és küldjék vissza. Ritkán alkalmazott.
Koncentrált: elég ritka eset, a sokaság egyedei között vannak olyanok, melyekhez képest a többi szinte elhanyagolható (dominánsak, sok van belőle), ezek kerülnek be a mintába, ezeket vizsgáljuk.
Önkényes: ez képezi az EV alapját. Káros lehet, mert engedjük a szubjektív szempontok érvényesülését.
Másodlagos, vagy ismételt mintavételi módszerek
Speciális csoport a gyakorlatban alkalmazott mintavételi módok között.
Elvi alapja az a felismerés, hogy a tényleges mintavétel igen költséges, míg a számítógép használata egyre olcsóbb -> a meglévő kisebb és olcsó mintákat számítógépes módszerekkel megtöbbszörözik.
A meglévő mintából újabb mintákat képeznek azért, hogy a mintában lévő információkat jobban kihasználják.