Stat felvételi Flashcards
KÍSÉRLET: egy kutató vizsgálni akarja xy gyógyszer meggyógyítja e a Z betegségben szenvedőket — mit csinál ennek kiderítésére?
-mikor valid eredmény- mikor lehet probléma
3 PONT
- statisztikusok az összehasonlítás! módszerével dolgoznak.
Arra kíváncsiak, hogy egy kezelésnek! (mint pl. a Salk-féle oltásnak) mi a hatása egy válaszra ! (így arra, megbetegszik-e valaki gyermekbénulásban).
=kezelt csoport összehasonlítása kontroll csoporttal
- Ha a kezelt csoport – a kezeléstől eltekintve – ugyanolyan, mint a kontrollcsoport, akkor a válaszok eltérését a két csoport között feltehetőleg a kezelés okozza.
- Ha viszont a kezelt csoport más tényezők tekintetében is különbözik a kontrollcsoporttól, akkor
a válaszok eltérését nem biztos hogy a kezelés okozza.
KÍSÉRLET : mit kell tenni ahhoz hogy a kezelt és a kontroll csoport hasonló legyen ?
sorsolt kontrollú kísérletek=
a kutatók a vizsgálat alanyait véletlenszerűen (sorsolással, random módon) sorolják a kezelt, illetőleg a kontrollcsoportba.
mit kell tenni ahhoz hogy pontosabban tudjam kiértékelni az eredményeket- kísérleteknél? 2 DOLOG
- Ha lehetséges, a kontrollcsoportnak placebót adnak – valami semlegeset, ami hasonlít a kezelésre. Jó tudni, hogy a kezelés vagy a kezelés gondolata okozza-e a választ.
- Kettős-vak kísérletnél az alanyok nem tudják, hogy a kezelt vagy a kontrollcsoportban vannak-e; és nem tudják ezt róluk az orvosok sem. Ez a válaszoknál és az értékelésnél is óv a torzítástól.
(cél: kísérleti elfogultság kiküszöbölése)
miben másak a megfigyelések mint a kísérletek?
Megfigyeléses vizsgálatnál nem a kutatók sorolják az alanyokat kezelt, és kontrollcsoportba. Az alanyok egy részére teljesül az a feltétel, amelynek hatását vizsgálják – ők a kezelt csoport. A többi alany alkotja a kontrollcsoportot
(nem kérhetek meg mint egy kísérletnél 10 embert hogy kezdjen már el a kutatásom miatt élete végéig cigizni- muszáj megfigyelnem eleve cigizőket)
mit lehet megállapítani jó esetben megfigyeléseknél- 2 dolog?
Megfigyeléses vizsgálatok alapján összefüggést lehet megállapítani. Lehet, hogy az összefüggés oksági kapcsolatra utal,
de: Az összefüggés nem bizonyítja az oksági kapcsolatot.
mi lehet a megfigyeléses vizsgálatok fő problémája/akadályozó tényezője?
Az összemosódás
olyan – a kezelésen túli – eltérés a kezelt, és a kontrollcsoport között, mely befolyásolja a tanulmányozott reakciót.
mit nevezünk kontrollált kísérletnek?
kutató döntésén múlik ki kap kezelést és ki nem
vizsgálatok fajtái?
lehet valami kontrollcsoportos vagy nem kontrollcsoportos vizsgálat
(kontrollcsoport: nem kap kezelést ugye)
ha van kontrollcsoport akkor
1, történeti (olyan beteg akiket régi módon kezeltek)
2, kortárs kontrollt használtak
ha kortárs kontroll használtak
akkor lehet
3, kontrollált kíséretről vagy 4, megfigyelésről szó
ha kontrollált kísérlet akkor
sorsolt kontrollú vagy nem sorsolt kontrollú vizsgálatról van szó
melyiket érdemes használni történeti kontroll vagy kortárs kontroll?
kortárs
hogyan küszöbölhető ki az összemosódás?
A megfigyeléses vizsgálatoknál kézben kell tartani az összemosó változókat. Az egyik eljárás az, hogy kisebb, egyneműbb csoportokat hasonlítunk össze. (Statisztikus zsargonban: bontunk, az összemosó változók szerint.)
összemosódás kiküszöbölésére példa? CSAK OLVASNI
Ha például az összes dohányosokat az összes nemdohányzókkal hasonlítanánk össze a halálozási arányszámok tekintetében, az valószínűleg félrevezető eredményt adna, mert a dohányosok között aránytalanul sok a férfi, és a férfiaknak általában is jelentősen nagyobb a hajlama a szívbetegségekre, mint a nőknek. Lehetséges volna tehát, hogy a dohányosok és nemdohányosok között mutatkozó különbséget ez a férfiak és nők közötti aránytalanság okozza. Hogy ezt a lehetőséget ki lehessen zárni, a dohányzó férfiakat a nemdohányzó férfiakkal hasonlítják össze az epidemiológusok, a dohányzó nőket pedig a nemdohányzó nőkkel.
Lehet az életkor is összemosó változó. Idősebb embereknek mások a dohányzási szokásai, és nagyobb az esélyük a tüdőrákra
mi a valószínűség? miben fejezzük ki?
Egy dolognak a valószínűsége megmondja, hogy ez a dolog az eseteknek várhatóan hány százalékában
következik be akkor, ha egymás után sokszor, egymástól függetlenül, s mindig ugyanolyan körülmények között
megismételjük az alapkísérletet.
A valószínűség 0% és 100% közé esik.
mi a függetlenség? PL?
Két esemény független, ha akármi az első kimenetele, a másodiknak változatlan marad a valószínűsége.
Ha két esemény független, akkor feltétel nélküli valószínűségeik szorzata megadja annak a valószínűségét,
hogy mindketten bekövetkeznek. Ez a szorzási szabály speciális esete.
Véletlenszerű húzás során a dobozban lévő mindegyik lap kihúzásának ugyanakkora az esélye. Ha a
húzásokat visszatevéssel végezzük, a húzások függetlenek. Visszatevés nélküli húzáskor a húzások
összefüggenek.
mi a szorzási szabály?
Tekintsünk két eseményt. Annak a valószínűségét, hogy ezek mindketten bekövetkeznek, megkapjuk, ha az
egyik bekövetkezésének valószínűségét összeszorozzuk annak a feltételes valószínűségével, hogy a másik
bekövetkezik, feltéve, hogy az első bekövetkezett. Ez a szorzási szabály.
valszínűségszámítás -mikor kölcsönösen kizáró két esemény?
egyik esemény bekövetkezése kizárja a másik esemény bekövetkezését
összeadási szabály?
Ha az a kérdés, hogy két esemény közül milyen valószínűséggel következik be legalább az
egyik, ellenőrizni kell, egymást kölcsönösen kizáró-e ez a két dolog. Ha igen, adjuk össze a valószínűségüket.
mit nevezünk elemek halmazának melyet vizsgálunk?
sokaság, populáció
mi az a minta és mire jó ?
a teljes populáció vizsgálata sokszor lehetetlen
ezért a populációnak csak egy részét vizsgálom
ezt nevem mintának
mintavétel célja?
a sokaság/populáció egészére nézve tudjunk következtetéseket megfogalmazni
mintavételes tétel- mit nevezünk paraméternek?
számszerű tények a sokaságról/populációról
pl: szavazásra jogosultak átlagéletkora
hogyan becsüljük meg a paramétereket?
és ezt mikor tehetjük meg eredményesen ?
statisztikákkal, az az a mintából kiszámolt számokkal becsüljük
Egy mintából csak akkor jogos paramétereket becsülnünk, ha a minta reprezentálja az alapsokaságot.
azt kell megnéznünk, hogyan választották ki
a mintát. Egyes eljárások jellemzően rosszul működnek. Mások nagy valószínűséggel
reprezentatív mintát adnak.
milyen típusú mintavételi hibák fordulhatnak elő?
1, Fedési hiba másnéven mintavételi torzítás : a mintavételi keret hibája, amely abból fakad, hogy nem mindenkinek van egyáltalán esélye a mintavételi keretbe kerülésre. (könyv -Literary Digest- kiből lesz elnök- gazdagok felülreprezentáltak)
2, Nem válaszolási hiba: amely abból ered, hogy nem mindenki válaszol a mintába kerültek közül.
3, Mérési hiba: az eszközök hibája, a válaszok hiteltelensége.
4, Feldolgozási hiba.
hogy fogalmazom meg azt statisztikaiul xd hogy a szegények közül nem kerültek be elegendően a mintába?
(mintavételi torzítés -fedési hiba esete -Digest példa rá)
A Digest kiválasztási eljárásában tehát igen erős torzítás rejlett a szegényekkel szemben
mintavételi torzítás esetén segít az ha nagyobb mintával dolgozunk? kiküszöböli a több válaszadó a fedési hibát?
nem (ha eleve rosszul választunk ki egyéneket akkor nem segít az hogy több egyén válaszait vizsgáljuk —kiválasztásunk a problémás)
nem válaszolási hiba más néven?
nem válaszolók torzítása (fellép)
nem válaszolási hiba miért rossz? -két példa
elég nagyon röviden tudni a példákat
A nem válaszolók erősen különbözhetnek a válaszolóktól. Nagyarányú válaszhiánynál figyeljünk oda a nem
válaszolók torzítására!
ok: kevésbé hajlamosak visszaküldeni a kérdőíveket az alacsony és a magas jövedelműek, tehát a válaszolók
között túlreprezentált a középosztály.
másik példa : a nem válaszolók
torzításának problémája személyes megkérdezés során is fennáll. Azok, akik a kérdező telefonhívásakor nem
voltak otthon, meglehetősen különbözhetnek az otthon talált emberektől – például munkaidejüket, családi
kötöttségeiket, társadalmi hátterüket tekintve, és így attitűdjeikben is
mintavételi eljárások két fajtája?-röviden mi alapján különböznek
1, véletlen mintavételi eljárások =valószínűségi
=a populáció minden tagjának egyforma esélye van a mintába való bekerülésre.
a véletlenszerűséget objektív módon kell biztosítani -véletlenszám generálás pl. erre eszköz
2, nem véletlen mintavételi eljárások
itt nincs véletlenszerűség abban, hogy mik/ kik alkotják a mintát
véletlen mintavételi eljárások?
független azonos eloszlású (mv)
egyszerű véletlen
rétegzett
csoportos
+többlépcsős mintavétel
független azonos eloszlású mintavétel mi?
független jelentése= a mintába kerülő elemeket visszatevéssel választják ki
azonos eloszlás jelentése=az elemek adatai nem változnak idő közben
problémát okozhat akkor, ha valamilyen szélsőséges elem többször bekerül a
mintába.
egyszerű véletlen mintavétel?
a populáció minden eleme egyenlő valószínűséggel kerülhet be, továbbá ezen eljárás alkalmazásakor a sokaságot nem osztjuk fel semmilyen alcsoportokra.
a felesleges duplikációk nélkül hasznosabbnak tűnik, de vannak olyan esetek amikben nem tudom garantálni, hogy kivegyem az illetőt/elemet =és ugyanúgy kell vele dolgozni
pl: ha kockával dobok ötöst akkor nem tudom leszedni a kocka 5-ös oldalát utána
A FAE módszer került előtérbe, mert egyszerűbb vele számolni.
Rétegzett mintavétel?
akkor indokolt alkalmazása ha a populáció jelentősen inhomogén
ha tudom, hogy vannak különböző részsokaságok
akkor a mintavétel is úgy zajlik majd, hogy a különböző rétegekből egyformán veszek elemszámot
pl: fiúkból veszek 5 elemű mintát, ha ők pl a kar negyedét teszik ki, lányokból egy 15 elemű mintát pedig
minden réteg megfelelően képviselve van.
Csoportos mintavétel?
ez pont abból indul ki, hogy a részsokaságok között nincs nagy különbség
egyforma részsokaságok közül kiválasztok egyet és azt megfigyelem
többlépcsős csoportos mintavétel? 2 infó
kiválasztok egy csoportot és azon belül is megvizsgálok egy csoportot
-kérdőívekkel foglalkozó szervezetek többsége ezt az eljárást alkalmazza
többlépcsős csoportos mintavétel példa?
pl: 4 régióra bontom az usát
régiókon belül összecsoportosítom a hasonló lakosságszámú településeket
-véletlenül kiválasztok párat
-véletlenül kiválasztok pár választókerületet
-véletlenül kiválasztok pár szavazókörzetet a választókerületeken belül
-véletlenszerűen háztartások is kiválasztva
(ezután is megvan adva általában hogy x éven felüli nőt vagy férfit kell megkérdezni ha az nincs otthon akkor kit )
(kérdezőbiztos ne válogathasson kedvére)
nem véletlen mintavétel fajtái?
-kvótákon alapuló
-koncentrált
-hólabda
-önkényes
kvótás mintavétel?
előre adott a minta bizonyos ismérvek szerinti összetétele, ezen belül szabadon választhatnak
vannak kvóták
pl:
50% a válaszadóknak férfi 50% nő
60% fehér 40% fekete
50% városi 50% vidéki
ezen belül hogy kit kérdez meg a kérdezőbiztos az egyéni döntés
koncentrált mintavételt mikor alkalmazunk?
a sokaságban van néhány elem, melynek nagyobb a befolyása a sokasági jellemzőre, mint a többi elemnek. Ilyen esetben a nagyobb befolyással rendelkező elemeket biztosan beválasztjuk a mintába, tehát nem beszélhetünk véletlen kiválasztásról.
(ha inflációs rátát számolok akkor inkább egy kiló kenyér árváltozását figyeljem meg és ne a barbie babák árváltozását)
hólabda mintavétel?
elindítok egy kérdőívet, de nem én gondoskodok róla, hogy ez kikhez fog kijutni, hanem több másik végzi a további adatfelvételt
pl: droghasználóknál felmérés
önkényes mintavétel?
kvázi szakértő eldönti, hogy kiket vesz bele a mintába
másnéven a véletlen mintavétel?
valószínűségi mintavételi módszerek
miért nem jó módszer a kvótás mintavétel?
-miféle emberekhez sétál oda szívesebben a kérdező
-ki fog elsétálni egy adott napszakban egy adott utcán
(nyugdíjasok, diákok, munkanélküliek?)
-szegényebb környéken van a kérdező, gazdagabb környéken
mind torzító hatással járhat
mit lehet tenni ha közvéleménykutatásnál a nem válaszolási arány nagy?
Valamelyest korrigálni lehet ezt úgy, hogy nagyobb súlyt rendelnek az elértek közül a csak nehezen elérhető
személyekhez.
mit lehet tenni ha túl nagy arányban kerültek be pl gazdagok vagy iskolázottak vagy szegények stb?
utólagos súlyozás !!! (szakszó)
-objektív számolási eljárás
kisebb torzításokat lehet vele kompenzálni
pl: az iskolázottak válaszainak kisebb súlyt adok -kisebb súllyal veszem figyelembe őket
1 mondatban: De miért működik ennyire jól a valószínűségi mintavétel?
(A megítélés és a választás azonban általában torzít, míg a véletlen pártatlan. Ezért
működnek jobban a valószínűségi eljárások, mint a megítélésen alapulók.)
Ahhoz, hogy a torzítást minimalizáljuk, pártatlan és objektív valószínűségi eljárásokat kell alkalmaznunk a
minta kiválasztásakor.
mintavételi torzítás és a nem válaszolók torzítása mellett milyen torzítás merülhet fel még? -SZAVAZÁS KAPCSÁN
ELSŐ
1.vannak emberek akik kérdőívben azt válaszolják hogy xy dolgot csinálnak, de egyébként nagy valószínűséggel nem fognak (pl: negatív megítélés alá esik ha valaki nem szavazik, nem akarják ezt beismerni az emberek)
-ez torzítja az eredményeket
-ki kell szűrni a komolytalan válaszadókat
választások esetén meg lehet kérdezni:
-legutóbb szavazott a választásokon?
-hol tervez szavazni idén –ha nem tud helyszínt megnevezni valaki az már kevésbé komoly szándékra utal
valószínű nem szavazók kiszűrése növeli az előrejelzés pontosságát
mintavételi torzítás és a nem válaszolók torzítása mellett milyen torzítás merülhet fel még? -SZAVAZÁS KAPCSÁN
MÁSODIK
úgy kell megfogalmazni a kérdéseket hogy a lehető legkisebb legyen a határozatlanok aránya
pl: szavazás -nem azt kérdezik meg kire fogok szavazni április 11én hanem: ha ma lenne a választás kire szavaznék
valamennyi bizonytalan ezután is marad— ezeknek a döntését meg kell tippelnie a közvéleménykutatónak
teheti ezt az alapján, hogy további kérdéseket tesz fel politikai attitűdjéről az adott embernek
a nagy előrejelzési hibáknak könnyen lehet magyarázója a bizonytalanok száma
milyen torzítás merülhet fel még? -nem bizonytalanok -nem is a nem szavazók- nem is a válaszadó száma- krédezőbiztos választása …..
a kérdezés torzítása
kapott válaszokat befolyásolhatja:
-kérdés megfogalmazása
-kérdező attitűdje
-kérdező hangneme
pl: 48-as elnökválasztás -jelöltek sorrendjének megváltoztatása 5 %-kal módosította a válaszokat
egységesíteni kell a kérdezés folyamatát amennyire csak lehetséges
ha mintavételnél mindent tökéletesen csinálok -tipikus hibákat elkerülöm - akkor minta alapján megtudom a tökéletes körülmények miatt pontosan becsülni a paramétert?
nem
kérdéses dolog aránya a mintában= valós arány a mintában (amire kíváncsiak vagyunk) + véletlen hiba
becslés= paraméter + torzítás + véletlen hiba (bonyibb eseteknél)
vagy
becslés = paraméter + véletlen hiba