Stat felvételi Flashcards

Question 1

Q

KÍSÉRLET: egy kutató vizsgálni akarja xy gyógyszer meggyógyítja e a Z betegségben szenvedőket — mit csinál ennek kiderítésére?

-mikor valid eredmény- mikor lehet probléma

3 PONT

Answer

A

statisztikusok az összehasonlítás! módszerével dolgoznak.

Arra kíváncsiak, hogy egy kezelésnek! (mint pl. a Salk-féle oltásnak) mi a hatása egy válaszra ! (így arra, megbetegszik-e valaki gyermekbénulásban).

=kezelt csoport összehasonlítása kontroll csoporttal

Ha a kezelt csoport – a kezeléstől eltekintve – ugyanolyan, mint a kontrollcsoport, akkor a válaszok eltérését a két csoport között feltehetőleg a kezelés okozza.
Ha viszont a kezelt csoport más tényezők tekintetében is különbözik a kontrollcsoporttól, akkor
a válaszok eltérését nem biztos hogy a kezelés okozza.

Question 2

Q

KÍSÉRLET : mit kell tenni ahhoz hogy a kezelt és a kontroll csoport hasonló legyen ?

Answer

A

sorsolt kontrollú kísérletek=

a kutatók a vizsgálat alanyait véletlenszerűen (sorsolással, random módon) sorolják a kezelt, illetőleg a kontrollcsoportba.

Question 3

Q

mit kell tenni ahhoz hogy pontosabban tudjam kiértékelni az eredményeket- kísérleteknél? 2 DOLOG

Answer

A

Ha lehetséges, a kontrollcsoportnak placebót adnak – valami semlegeset, ami hasonlít a kezelésre. Jó tudni, hogy a kezelés vagy a kezelés gondolata okozza-e a választ.
Kettős-vak kísérletnél az alanyok nem tudják, hogy a kezelt vagy a kontrollcsoportban vannak-e; és nem tudják ezt róluk az orvosok sem. Ez a válaszoknál és az értékelésnél is óv a torzítástól.
(cél: kísérleti elfogultság kiküszöbölése)

Question 4

Q

miben másak a megfigyelések mint a kísérletek?

Answer

A

Megfigyeléses vizsgálatnál nem a kutatók sorolják az alanyokat kezelt, és kontrollcsoportba. Az alanyok egy részére teljesül az a feltétel, amelynek hatását vizsgálják – ők a kezelt csoport. A többi alany alkotja a kontrollcsoportot

(nem kérhetek meg mint egy kísérletnél 10 embert hogy kezdjen már el a kutatásom miatt élete végéig cigizni- muszáj megfigyelnem eleve cigizőket)

Question 5

Q

mit lehet megállapítani jó esetben megfigyeléseknél- 2 dolog?

Answer

A

Megfigyeléses vizsgálatok alapján összefüggést lehet megállapítani. Lehet, hogy az összefüggés oksági kapcsolatra utal,

de: Az összefüggés nem bizonyítja az oksági kapcsolatot.

Question 6

Q

mi lehet a megfigyeléses vizsgálatok fő problémája/akadályozó tényezője?

Answer

A

Az összemosódás

olyan – a kezelésen túli – eltérés a kezelt, és a kontrollcsoport között, mely befolyásolja a tanulmányozott reakciót.

Question 7

Q

mit nevezünk kontrollált kísérletnek?

Answer

A

kutató döntésén múlik ki kap kezelést és ki nem

Question 8

Q

vizsgálatok fajtái?

Answer

A

lehet valami kontrollcsoportos vagy nem kontrollcsoportos vizsgálat

(kontrollcsoport: nem kap kezelést ugye)

ha van kontrollcsoport akkor
1, történeti (olyan beteg akiket régi módon kezeltek)
2, kortárs kontrollt használtak

ha kortárs kontroll használtak
akkor lehet
3, kontrollált kíséretről vagy 4, megfigyelésről szó

ha kontrollált kísérlet akkor
sorsolt kontrollú vagy nem sorsolt kontrollú vizsgálatról van szó

Question 9

Q

melyiket érdemes használni történeti kontroll vagy kortárs kontroll?

Question 10

Q

hogyan küszöbölhető ki az összemosódás?

Answer

A

A megfigyeléses vizsgálatoknál kézben kell tartani az összemosó változókat. Az egyik eljárás az, hogy kisebb, egyneműbb csoportokat hasonlítunk össze. (Statisztikus zsargonban: bontunk, az összemosó változók szerint.)

Question 11

Q

összemosódás kiküszöbölésére példa? CSAK OLVASNI

Answer

A

Ha például az összes dohányosokat az összes nemdohányzókkal hasonlítanánk össze a halálozási arányszámok tekintetében, az valószínűleg félrevezető eredményt adna, mert a dohányosok között aránytalanul sok a férfi, és a férfiaknak általában is jelentősen nagyobb a hajlama a szívbetegségekre, mint a nőknek. Lehetséges volna tehát, hogy a dohányosok és nemdohányosok között mutatkozó különbséget ez a férfiak és nők közötti aránytalanság okozza. Hogy ezt a lehetőséget ki lehessen zárni, a dohányzó férfiakat a nemdohányzó férfiakkal hasonlítják össze az epidemiológusok, a dohányzó nőket pedig a nemdohányzó nőkkel.

Lehet az életkor is összemosó változó. Idősebb embereknek mások a dohányzási szokásai, és nagyobb az esélyük a tüdőrákra

Question 12

Q

mi a valószínűség? miben fejezzük ki?

Answer

A

Egy dolognak a valószínűsége megmondja, hogy ez a dolog az eseteknek várhatóan hány százalékában
következik be akkor, ha egymás után sokszor, egymástól függetlenül, s mindig ugyanolyan körülmények között
megismételjük az alapkísérletet.

A valószínűség 0% és 100% közé esik.

Question 13

Q

mi a függetlenség? PL?

Answer

A

Két esemény független, ha akármi az első kimenetele, a másodiknak változatlan marad a valószínűsége.

Ha két esemény független, akkor feltétel nélküli valószínűségeik szorzata megadja annak a valószínűségét,
hogy mindketten bekövetkeznek. Ez a szorzási szabály speciális esete.

Véletlenszerű húzás során a dobozban lévő mindegyik lap kihúzásának ugyanakkora az esélye. Ha a
húzásokat visszatevéssel végezzük, a húzások függetlenek. Visszatevés nélküli húzáskor a húzások
összefüggenek.

Question 14

Q

mi a szorzási szabály?

Answer

A

Tekintsünk két eseményt. Annak a valószínűségét, hogy ezek mindketten bekövetkeznek, megkapjuk, ha az
egyik bekövetkezésének valószínűségét összeszorozzuk annak a feltételes valószínűségével, hogy a másik
bekövetkezik, feltéve, hogy az első bekövetkezett. Ez a szorzási szabály.

Question 15

Q

valszínűségszámítás -mikor kölcsönösen kizáró két esemény?

Answer

A

egyik esemény bekövetkezése kizárja a másik esemény bekövetkezését

Question 16

Q

összeadási szabály?

Answer

A

Ha az a kérdés, hogy két esemény közül milyen valószínűséggel következik be legalább az
egyik, ellenőrizni kell, egymást kölcsönösen kizáró-e ez a két dolog. Ha igen, adjuk össze a valószínűségüket.

Question 17

Q

mit nevezünk elemek halmazának melyet vizsgálunk?

Answer

A

sokaság, populáció

Question 18

Q

mi az a minta és mire jó ?

Answer

A

a teljes populáció vizsgálata sokszor lehetetlen

ezért a populációnak csak egy részét vizsgálom

ezt nevem mintának

Question 19

Q

mintavétel célja?

Answer

A

a sokaság/populáció egészére nézve tudjunk következtetéseket megfogalmazni

Question 20

Q

mintavételes tétel- mit nevezünk paraméternek?

Answer

A

számszerű tények a sokaságról/populációról

pl: szavazásra jogosultak átlagéletkora

Question 21

Q

hogyan becsüljük meg a paramétereket?

és ezt mikor tehetjük meg eredményesen ?

Answer

A

statisztikákkal, az az a mintából kiszámolt számokkal becsüljük

Egy mintából csak akkor jogos paramétereket becsülnünk, ha a minta reprezentálja az alapsokaságot.

azt kell megnéznünk, hogyan választották ki
a mintát. Egyes eljárások jellemzően rosszul működnek. Mások nagy valószínűséggel
reprezentatív mintát adnak.

Question 22

Q

milyen típusú mintavételi hibák fordulhatnak elő?

Answer

A

1, Fedési hiba másnéven mintavételi torzítás : a mintavételi keret hibája, amely abból fakad, hogy nem mindenkinek van egyáltalán esélye a mintavételi keretbe kerülésre. (könyv -Literary Digest- kiből lesz elnök- gazdagok felülreprezentáltak)

2, Nem válaszolási hiba: amely abból ered, hogy nem mindenki válaszol a mintába kerültek közül.
3, Mérési hiba: az eszközök hibája, a válaszok hiteltelensége.
4, Feldolgozási hiba.

Question 23

Q

hogy fogalmazom meg azt statisztikaiul xd hogy a szegények közül nem kerültek be elegendően a mintába?
(mintavételi torzítés -fedési hiba esete -Digest példa rá)

Answer

A

A Digest kiválasztási eljárásában tehát igen erős torzítás rejlett a szegényekkel szemben

Question 24

Q

mintavételi torzítás esetén segít az ha nagyobb mintával dolgozunk? kiküszöböli a több válaszadó a fedési hibát?

Answer

A

nem (ha eleve rosszul választunk ki egyéneket akkor nem segít az hogy több egyén válaszait vizsgáljuk —kiválasztásunk a problémás)

Question 25

Q

nem válaszolási hiba más néven?

Answer

A

nem válaszolók torzítása (fellép)

Question 26

Q

nem válaszolási hiba miért rossz? -két példa

elég nagyon röviden tudni a példákat

Answer

A

A nem válaszolók erősen különbözhetnek a válaszolóktól. Nagyarányú válaszhiánynál figyeljünk oda a nem
válaszolók torzítására!

ok: kevésbé hajlamosak visszaküldeni a kérdőíveket az alacsony és a magas jövedelműek, tehát a válaszolók
között túlreprezentált a középosztály.

másik példa : a nem válaszolók
torzításának problémája személyes megkérdezés során is fennáll. Azok, akik a kérdező telefonhívásakor nem
voltak otthon, meglehetősen különbözhetnek az otthon talált emberektől – például munkaidejüket, családi
kötöttségeiket, társadalmi hátterüket tekintve, és így attitűdjeikben is

Question 27

Q

mintavételi eljárások két fajtája?-röviden mi alapján különböznek

Answer

A

1, véletlen mintavételi eljárások =valószínűségi
=a populáció minden tagjának egyforma esélye van a mintába való bekerülésre.
a véletlenszerűséget objektív módon kell biztosítani -véletlenszám generálás pl. erre eszköz

2, nem véletlen mintavételi eljárások
itt nincs véletlenszerűség abban, hogy mik/ kik alkotják a mintát

Question 28

Q

véletlen mintavételi eljárások?

Answer

A

független azonos eloszlású (mv)

egyszerű véletlen

rétegzett

csoportos

+többlépcsős mintavétel

Question 29

Q

független azonos eloszlású mintavétel mi?

Answer

A

független jelentése= a mintába kerülő elemeket visszatevéssel választják ki
azonos eloszlás jelentése=az elemek adatai nem változnak idő közben

problémát okozhat akkor, ha valamilyen szélsőséges elem többször bekerül a
mintába.

Question 30

Q

egyszerű véletlen mintavétel?

Answer

A

a populáció minden eleme egyenlő valószínűséggel kerülhet be, továbbá ezen eljárás alkalmazásakor a sokaságot nem osztjuk fel semmilyen alcsoportokra.

a felesleges duplikációk nélkül hasznosabbnak tűnik, de vannak olyan esetek amikben nem tudom garantálni, hogy kivegyem az illetőt/elemet =és ugyanúgy kell vele dolgozni

pl: ha kockával dobok ötöst akkor nem tudom leszedni a kocka 5-ös oldalát utána

A FAE módszer került előtérbe, mert egyszerűbb vele számolni.

Question 31

Q

Rétegzett mintavétel?

Answer

A

akkor indokolt alkalmazása ha a populáció jelentősen inhomogén

ha tudom, hogy vannak különböző részsokaságok
akkor a mintavétel is úgy zajlik majd, hogy a különböző rétegekből egyformán veszek elemszámot

pl: fiúkból veszek 5 elemű mintát, ha ők pl a kar negyedét teszik ki, lányokból egy 15 elemű mintát pedig

minden réteg megfelelően képviselve van.

Question 32

Q

Csoportos mintavétel?

Answer

A

ez pont abból indul ki, hogy a részsokaságok között nincs nagy különbség
egyforma részsokaságok közül kiválasztok egyet és azt megfigyelem

Question 33

Q

többlépcsős csoportos mintavétel? 2 infó

Answer

A

kiválasztok egy csoportot és azon belül is megvizsgálok egy csoportot

-kérdőívekkel foglalkozó szervezetek többsége ezt az eljárást alkalmazza

Question 34

Q

többlépcsős csoportos mintavétel példa?

Answer

A

pl: 4 régióra bontom az usát

régiókon belül összecsoportosítom a hasonló lakosságszámú településeket
-véletlenül kiválasztok párat

-véletlenül kiválasztok pár választókerületet

-véletlenül kiválasztok pár szavazókörzetet a választókerületeken belül

-véletlenszerűen háztartások is kiválasztva

(ezután is megvan adva általában hogy x éven felüli nőt vagy férfit kell megkérdezni ha az nincs otthon akkor kit )
(kérdezőbiztos ne válogathasson kedvére)

Question 35

Q

nem véletlen mintavétel fajtái?

Answer

A

-kvótákon alapuló
-koncentrált
-hólabda
-önkényes

Question 36

Q

kvótás mintavétel?

Answer

A

előre adott a minta bizonyos ismérvek szerinti összetétele, ezen belül szabadon választhatnak

vannak kvóták

pl:
50% a válaszadóknak férfi 50% nő
60% fehér 40% fekete
50% városi 50% vidéki

ezen belül hogy kit kérdez meg a kérdezőbiztos az egyéni döntés

Question 37

Q

koncentrált mintavételt mikor alkalmazunk?

Answer

A

a sokaságban van néhány elem, melynek nagyobb a befolyása a sokasági jellemzőre, mint a többi elemnek. Ilyen esetben a nagyobb befolyással rendelkező elemeket biztosan beválasztjuk a mintába, tehát nem beszélhetünk véletlen kiválasztásról.

(ha inflációs rátát számolok akkor inkább egy kiló kenyér árváltozását figyeljem meg és ne a barbie babák árváltozását)

Question 38

Q

hólabda mintavétel?

Answer

A

elindítok egy kérdőívet, de nem én gondoskodok róla, hogy ez kikhez fog kijutni, hanem több másik végzi a további adatfelvételt
pl: droghasználóknál felmérés

Question 39

Q

önkényes mintavétel?

Answer

A

kvázi szakértő eldönti, hogy kiket vesz bele a mintába

Question 40

Q

másnéven a véletlen mintavétel?

Answer

A

valószínűségi mintavételi módszerek

Question 41

Q

miért nem jó módszer a kvótás mintavétel?

Answer

A

-miféle emberekhez sétál oda szívesebben a kérdező
-ki fog elsétálni egy adott napszakban egy adott utcán
(nyugdíjasok, diákok, munkanélküliek?)
-szegényebb környéken van a kérdező, gazdagabb környéken

mind torzító hatással járhat

Question 42

Q

mit lehet tenni ha közvéleménykutatásnál a nem válaszolási arány nagy?

Answer

A

Valamelyest korrigálni lehet ezt úgy, hogy nagyobb súlyt rendelnek az elértek közül a csak nehezen elérhető
személyekhez.

Question 43

Q

mit lehet tenni ha túl nagy arányban kerültek be pl gazdagok vagy iskolázottak vagy szegények stb?

Answer

A

utólagos súlyozás !!! (szakszó)

-objektív számolási eljárás

kisebb torzításokat lehet vele kompenzálni
pl: az iskolázottak válaszainak kisebb súlyt adok -kisebb súllyal veszem figyelembe őket

Question 44

Q

1 mondatban: De miért működik ennyire jól a valószínűségi mintavétel?

Answer

A

(A megítélés és a választás azonban általában torzít, míg a véletlen pártatlan. Ezért
működnek jobban a valószínűségi eljárások, mint a megítélésen alapulók.)

Ahhoz, hogy a torzítást minimalizáljuk, pártatlan és objektív valószínűségi eljárásokat kell alkalmaznunk a
minta kiválasztásakor.

Question 45

Q

mintavételi torzítás és a nem válaszolók torzítása mellett milyen torzítás merülhet fel még? -SZAVAZÁS KAPCSÁN

ELSŐ

Answer

A

1.vannak emberek akik kérdőívben azt válaszolják hogy xy dolgot csinálnak, de egyébként nagy valószínűséggel nem fognak (pl: negatív megítélés alá esik ha valaki nem szavazik, nem akarják ezt beismerni az emberek)
-ez torzítja az eredményeket
-ki kell szűrni a komolytalan válaszadókat

választások esetén meg lehet kérdezni:
-legutóbb szavazott a választásokon?
-hol tervez szavazni idén –ha nem tud helyszínt megnevezni valaki az már kevésbé komoly szándékra utal

valószínű nem szavazók kiszűrése növeli az előrejelzés pontosságát

Question 46

Q

mintavételi torzítás és a nem válaszolók torzítása mellett milyen torzítás merülhet fel még? -SZAVAZÁS KAPCSÁN

MÁSODIK

Answer

A

úgy kell megfogalmazni a kérdéseket hogy a lehető legkisebb legyen a határozatlanok aránya

pl: szavazás -nem azt kérdezik meg kire fogok szavazni április 11én hanem: ha ma lenne a választás kire szavaznék

valamennyi bizonytalan ezután is marad— ezeknek a döntését meg kell tippelnie a közvéleménykutatónak

teheti ezt az alapján, hogy további kérdéseket tesz fel politikai attitűdjéről az adott embernek

a nagy előrejelzési hibáknak könnyen lehet magyarázója a bizonytalanok száma

Question 47

Q

milyen torzítás merülhet fel még? -nem bizonytalanok -nem is a nem szavazók- nem is a válaszadó száma- krédezőbiztos választása …..

Answer

A

a kérdezés torzítása

kapott válaszokat befolyásolhatja:
-kérdés megfogalmazása
-kérdező attitűdje
-kérdező hangneme

pl: 48-as elnökválasztás -jelöltek sorrendjének megváltoztatása 5 %-kal módosította a válaszokat

egységesíteni kell a kérdezés folyamatát amennyire csak lehetséges

Question 48

Q

ha mintavételnél mindent tökéletesen csinálok -tipikus hibákat elkerülöm - akkor minta alapján megtudom a tökéletes körülmények miatt pontosan becsülni a paramétert?

Answer

A

nem

kérdéses dolog aránya a mintában= valós arány a mintában (amire kíváncsiak vagyunk) + véletlen hiba

becslés= paraméter + torzítás + véletlen hiba (bonyibb eseteknél)
vagy
becslés = paraméter + véletlen hiba

Question 49

Q

véletlen hiba másik neve?

Answer

A

mintavételi hiba

Question 50

Q

mintavételi hiba vagy véletlen hiba miből ered?

Answer

A

abból ered, hogy a kutatásban alkalmazott minta nem tükrözi teljes mértékben a reprezentálni kívánt alapsokaságot.

‖ abból fakad, hogy a minta csak egy része az
egésznek.

Question 51

Q

torzítás másik néven és miből ered?

Answer

A

„nem mintavételi hibának‖ hívjuk – a hiba forrása valami más, például a
kimaradt megkérdezendők, a nem válaszolók.

nem azért más az eredmény mert mintát használok és nem az egész sokaság vizsgálom meg

Question 52

Q

tétel: 3. Becslés, konfidencia intervalum: miért van szükség becslésre,

Miért van szükség becslésre és mi a becslés, + két fajtája?

Answer

A

becslés: sokasági jellemző közelítő értékének előállítása a minta alapján

a minta alapján akarok következtetni a sokaságra vonatkozóan
ez egy érezhetően nehéz feladat-egy közelítő értéket viszont megtudhatunk

megkülönböztetünk:
1.: pontbecslést-egyetlen értéket határozunk meg
2.: intervallumbecslést- egy olyan intervallumot meghatározunk, melyben nagy valószínűséggel benne van a vizsgált jellemző

Question 53

Q

Becslés- standard hibának mi a szerepe? Mitől függ a nagysága-példa

Answer

A

Megmutatja, hogy a valóságtól mennyire messze szoktak lenni a becslések.

Standard hiba nagysága egyenesen arányos a szórással ami tök logikus
mit mutat meg a szórás? Hogy az adataim mennyire különböznek egymástól
és minél inkább különbözőek ezek az adatok annál nehezebb megbecsülni vmit

pl: ha a 10 legnagyobb népességű város alapján akarok egy magyar átlagváros népességet megbecsülni, akkor logikus hogy Budapest lakosai nagyon pontatlanná fogják tenni az eredményt a maguk millióival

Ezt a hibát akarom minimalizálni ugyebár.

minél nagyobb az elemszám, annál kisebb hibát véthetünk.

Question 54

Q

sokasági átlagra vagyok kíváncsi ebben az esetben mit mutat meg a standard hiba?

Answer

A

=valóságtól mennyire szoktak messze lenni a becslések

a mintaátlagok szóródása a sokasági átlag körül

Question 55

Q

Ha a minta és a sokaság mérete megegyezik, mekkora a standard hiba?

Question 56

Q

Elvárható a torzítatlanság becslés terén?

Answer

A

egy mintától nem várhatom el, hogy jellemezze tökéletesen a sokaságot, de a torzítatlanságot elvárom.

Ez mit jelent? Mintajellemzők átlaga a sokasági jellemző—ezt úgy tudjuk leellenőrizni, hogy veszek egy pl 180 adatot tartalmazó halmazból és az összes létező pl. 10 darabos mintát megnézem, hogy mennyi az átlaguk

és ha azon mintajellemzők átlagosan megegyeznek a sokasági átlaggal -akkor jó munkát végeztünk

nem egy eseti mintaátlagnak kell megegyeznie vele, hanem az összes mintán vett mintaátlagok átlagának

Tehát jó esetben a „mintaátlagok átlaga” megegyezik a sokasági átlaggal

Question 57

Q

FONTOS

Becsléselmélet tétel: Hogyan kéne befejezni ezt a mondatot:

Valószínűségi mintáknál a véletlen hiba valószínű nagyságát megadja a….

Answer

A

standard hiba

Question 58

Q

Becsléselmélet tétel: Igaz az állítás?

Egyszerű véletlen mintánál a mintabeli százalékarány várható értéke megegyezik az alapsokaságon belüli
százalékaránnyal.

Answer

A

részben csak

megegyezik nagyjából de van standard hiba

Question 59

Q

Ha feladat elém kerülne akkor automatikusan tudnám hogyan kéne standard hibát 100%-ban kifejezni de megkéne tanulni erre a képletet:

százalékarány standard hibája=

Answer

A

(darabszám st hibája / minta nagysága ) * 100%

Question 60

Q

tudjuk hogy 400 húzás van és az x esetek (amik nekünk jók) standard hibája 16

százalékarány standard hibája mennyi?

Answer

A

16/400 *100 = 4 %

(de ez az utolsó dolog amit élőben elrontanék)

Question 61

Q

Egy piros és kék golyókat tartalmazó dobozból húzunk. Töltse ki az üresen hagyott helyeket!

a. A piros golyók __________ százalékarányának várható értéke megegyezik a piros golyók __________
százalékarányával. Válaszlehetőségek: mintabeli, alapsokaságbeli

b. Ha több golyót húzunk, akkor a piros golyók _________ standard hibája a mintában megnő, a piros golyók
_________ standard hibája viszont lecsökken. Válaszlehetőségek: számának; százalékarányának

Answer

A

válasz:

a. A piros golyók mintabeli százalékarányának várható értéke megegyezik a piros golyók alapsokaságbeli százalékarányával.

b. Ha több golyót húzunk, akkor a piros golyók számának standard hibája a mintában megnő, a piros golyók
százalékarányának standard hibája viszont lecsökken.

Question 62

Q

elnökválasztás eredményeit akarjuk megbecsülni

Új-Mexikóban mintegy 1,2 millió választópolgár él,
Texas államban 12,5 millió. Tegyük fel, hogy az egyik közvéleménykutató cég a demokrata szavazók arányának
becsléséhez 2500 fős egyszerű véletlen mintát vesz Új-Mexikóban Egy másik cég Texas államban vesz 2500 fős egyszerű véletlen mintát ugyanezen célból. A két cég pontosan ugyanolyan módszerrel dolgozik. Mindkét becslés valószínűleg mellé lő majd egy kicsit a véletlen hiba miatt. Vajon melyiküknél lesz kisebb valószínűsíthetően a véletlen hiba?

Answer

A

Valójában az új-mexikói
és a texasi közvéleménykutatás lényegében egyformán pontosnak várható.

Képzeljük el, hogy vegyelemzéshez egy
csepp mintát veszünk egy folyadékból. Ha a folyadék jól el van keveredve, akkor a csepp kémiai összetétele
tükrözi az egész üveg összetételét, és igazán nem számít, hogy egy kis üvegcséből vagy egy nagy kancsóból
vettük a mintát. A vegyész mit sem törődik azzal, hogy a csepp az oldatnak 1%-a vagy 0,01%-a.

Question 63

Q

Visszatevés nélküli vagy visszatevéses esetekben nagyobb a standard hiba?

Answer

A

Ha visszatevés nélkül húzunk, kicsivel csökken a
doboz, és így enyhén lecsökken a szóródás. Visszatevés nélküli húzásoknál ezért picivel kisebb a standard hiba.

Visszatevéses esetekben valamivel nagyobb.

Question 64

Q

Standard hibát hogyan számolom ki?

Answer

A

gyök alatt húzások száma * szórás

egyébként: dobozmodell alapján

**férfiak 1-esek **—0,6 arány
nők 0-ák —0,4

ekkor szórás: gyök alatt 0,6 * 0,4 !!!!!!!!!!!!!!!!

Answer 63

A

-ha vissztevéses húzás van akkor nem
-ha visszatevés nélküli akkor lehet
attól függ hogy pl 10 milliós alapsokaságból ha veszek egy 10 fős mintát akkor nem kell-standard hibát normál módon számolom

ha: pl 10 milliós alapsokaságból a negyede a mintám akkor kell korrekciós szorzó (feltéve: nincs visszatétel)

Answer 64

A

gyök alatt minden

20 ezer (összsokaság) - 5 ezer (minta)
/

20 ezer -1

**GYÖK ALATT és mindig mínusz 1 a vége

összsok- minta
/
összsok-1

visszatev nélküli standard hiba =korr szorzó * visszatevéses standard hiba

Answer 65

A

a doboz ismeretlen
megoszlását a mintában megfigyelt részaránnyal helyettesítik be.

behelyettesített arányok —ez alapján megnézzük a szórást és a standard hibát

Answer 66

A

Példánkban a 2500 fős mintából 1328 ember
volt a képviselőjelölt mellett. Tehát a mintában 1328 / 2500 ≈ 0,53, azaz 53% támogatta őt, 47% volt ellene.
Becslésünk az, hogy a dobozban lévő 100 000 cédula 0,53-adrészén áll 1-es, a többi cédulán 0.
Ennek alapján a doboz szórását így becsüljük: . A képviselőjelöltet támogató szavazók
mintabeli számának standard hibáját tehát (gyök alatt 2500 * 0,5 -re) becsüljük. (0.5 mert: gyök alatt 0.53*gyök alatt 0.47)Ez a szám mutatja az 1328 fő véletlen
hibájának valószínű nagyságát. A 2500 fős mintából ez a 25 fő 1%-ot tesz ki. A mintában a támogatók
százalékarányának standard hibáját így 1 százalékpontra becsüljük. Ezzel készen vagyunk a standard hiba
becslésére szolgáló ún. „bootstrap‖ iieljárás végrehajtásával.

Answer 67

A

persze ekkor a becslésünk alálőtt

pl: -4 st hib
azt jelenti pl hogy 68% helyett 72% helyes

Answer 68

A

68%ig biztos hogy a populáció százalékaránya:
77% és 81% közötti (+/- 1 SH)

95%ig biztos, hogy a populáció százalékaránya:
75% és 83% közötti (+/- 2 SH)

99,7%ig biztosak lehetünk abban, hogy a populáció százalékaránya:
73% és 85% közötti (+/- 3 SH)

Answer 69

A

megbízhatósági szint: 95%

Answer 70

A

Egy szignifikanciapróba azzal a kérdéssel foglalkozik, hogy valóságos-e a megfigyelt eltérés (ez az ellenhipotézis), vagy pusztán véletlen ingadozás (ez a nullhipotézis).

Az az alapgondolatuk, hogy ha egy megfigyelt érték túl sok standard hibányira esik a várható értékétől, azt nehéz véletlennel magyarázni.

Answer 71

A

A százalék egy adott számnak a század részét jelenti, ezzel szemben a százalékpont egységnyi százalék változását jelöl. Például 40 százaléknak a 10 százalékos növekedése 44 százalékot, a 10 százalékpontos növekedése pedig 50 százalékot eredményez.

Answer 72

A

A nullhipotézis azt az elgondolást fejezi ki, hogy a megfigyelt eltérést (a várható és a megfigyelt érték között) a véletlen okozza.

Az ellenhipotézis ennek ellenkezőjét állítja.

Answer 73

A

A próbastatisztika arra való, hogy mérje, mennyire térnek el az adatok a nullhipotézis alapján várható értéktől.

Answer 74

A

= megfigyelt érték- várható érték
__________________________________
standard hiba

A z azt mondja meg, hogy a megfigyelt érték hány standard hibányira esik a nullhipotézis alapján kiszámolt várható értéktől.

Answer 75

A

nem simán kiszámolom
megnézem az átlagot és stb

Answer 76

A

A megfigyelt szignifikanciaszint (P-nek vagy P-értéknek is nevezik) annak a valószínűsége, hogy annyira
szélsőséges próbastatisztikát kapunk, mint amilyet megfigyeltünk, vagy még szélsőségesebbet. Kiszámításakor
úgy számolunk, mintha a nullhipotézis igaz lenne. Tehát a P nem azt mondja meg, hogy milyen valószínűséggel
igaz a nullhipotézis.

Answer 77

A

Természetesen adódik a kérdés, mennyire kell kicsinek lennie a megfigyelt szignifikanciaszintnek ahhoz, hogy a
kutató elvethesse a nullhipotézist. Sok statisztikus 5%-nál húzza meg a határt.
* Ha P kisebb 5%-nál, akkor statisztikailag szignifikáns-nak nevezzük az eredményt.
Egy másik határvonal is van, 1%-nál.
* Ha P kisebb 1%-nál, akkor az eredmény erősen szignifikáns.

Answer 78

A

meg kell fogalmaznunk a nullhipotézist; ez egy, az adatokra vonatkozó dobozmodell lesz;
ki kell választanunk egy alkalmas próbastatisztikát – ezzel fogjuk mérni, mennyire térnek el az adatok a
nullhipotézis alapján várhatótól;
ki kell számítanunk a megfigyelt szignifikanciaszintet, azaz P-t.

Answer 79

A

kis minták esetén

pl van négy vagy 5 mérésem

Answer 80

A

Student-görbét akkor használunk, ha
* Olyanok az adatok, mintha egy dobozból végeznénk húzásokat.
* Nem ismerjük a doboz szórását.
* A megfigyelések száma kicsi, emiatt a doboz szórását nem tudjuk igazán pontosan megbecsülni.
* A dobozban lévő számokra vonatkozó hisztogram nem sokkal tér el a normálgörbétől.

Nagyobb számú megfigyelés esetén (mondjuk 25 fölött) rendszerint a normálgörbét használjuk. Ha ismerjük a
doboz szórását és ha a dobozbeli számok a normálgörbét követik, akkor kis mintáknál is használhatjuk a
normálgörbét.

Answer 81

A

Z próba így nézett ki:

megfigyelt érték - várható érték
____________________________

standard hiba

standard hiba kiszámítása változik

standard hiba egyébként = gyök alatt:mérések/húzások száma * szórás

**itt mi változik: szórás **

szórás = korrigált szórás * szórás

korrigált szórás =

ha mérések száma = 4

gyök alatt minden
mérések száma
________________ * szórás
mérések száma - 1

Answer 82

A

igaz

magyarázat:
Igaz; z=(megfigyelt – várható)/standard hiba; “várható”-t a nullhipotézis alapján számolva.

Answer 83

A

Két független mennyiség eltérésének standard hibája

gyök alatt
a^2 + b^2

• a az első mennyiség standard hibája;
• b a második mennyiség standard hibája.

Answer 84

A

arra keressük a választ, hogy két minta alapján kijött értékek közötti eltérés magyarázható-e véletlen ingadozással vagy sem

képlet: **(csak alul változik) **

megfigyelt érték - várható érték(régebbi)
___________________
st hiba **(mintaátlagok közötti eltérés!! stb hibája) **

Answer 85

A

a két mintaelemszámot,
a két mintaátlagot,
a két minta szórását.

A próba két **független, egyszerű véletlen **mintára alkalmazható.

Általában hibás eredményt kapunk, ha a
képleteket összefüggő mintákra alkalmazzuk. Van kivétel: használhatjuk a z-próbát arra, hogy a kezelt és a
kontrollcsoportot egy sorsolt kontrollú kísérletben összehasonlítsuk – még olyankor is, amikor a csoportok
összefüggenek

Answer 86

A

kétmintás

Answer 87

A

bár a minták nem függetlenek lehet

Answer 88

A

visszatevéses st hibát kell számítani akkoris ha visszatétel nélkül történt a mintavétel!

Answer 89

A

nem

csak az 5% az aminél a többség meghúzza a határt

Answer 90

A

1% alatti p -érték nem jelzi azt hogy mindenesetben sokat nyom latba az eltérés amit észrevettünk lehet gyakorlati jelentősége nincs

Answer 91

A

Egyoldalú próbát használunk, hogyha az ellenhipotézis azt mondja, hogy a doboz átlaga nagyobb egy bizonyos értéknél. Kétoldalú próbát használunk, ha az ellenhipotézis annyit mond, hogy a doboz átlaga eltér egy bizonyos értéktől – kisebb vagy nagyobb nála.

Answer 92

A

a várható és a megfigyelt gyakoriságok
közötti távolságot méri.

X^2(khi négyzet) = (megfigyelt gyakoriság - várható gyak)^2
————————-
várható gyak

magas khi érték: távol esnek a gyakoriságok
alacsony: megfigyelt gyakoriságok a várhatóak közelében maradnak

megértéséhez példa: megakartuk figyelni hogy gyanúsan sokszor jön-e ki valami érték
0-1 dobozmodell felállítása- pl ha két kategória van-
1, bejön a tipp 2, nem jön be a tipp
megnézzük melyiknek mekkora az esélye (1/6 vagy ilyesmi)

de: dobókocka pl hogyan tudjuk meg hogy szabályos vagy megcinkelték?
van hat kategória - nem állíthatok fel dobozmodellt- kell a khi próba

Answer 93

A

(Ha számít, hogy melyik fajta lapból hány van a
dobozban, a χ
2
-próba a jó; ha viszont csak a doboz átlaga számít, dolgozzunk z-próbával.)

A χ2
-próba megmondja, hogy adataink olyanok-e, mintha egy adott összetételű dobozból végeztünk volna
véletlen húzásokat.
A z-próba megmondja, hogy adataink olyanok-e, mintha egy adott átlagú dobozból végeztünk volna véletlen
húzásokat.

Answer 94

A

várható gyakoriságok átlaga

Answer 95

A

képlet alapján megkapjuk a khi értéket

megnézzük a szabadságfokokat (nem függetlenségvizgsálat esetében) : összeadandó törtek khi képletben - 1

szabadságfokok táblázatban- jobboldalra fekvő értékek %át jelzi a fenti szám

Answer 96

A

függetlenségvizsgálat

(pl: befolyásolja-e a jobb vagy balkezességet hogy nő vagy férfi vagy)

p érték ugyanúgy jobbra fekvő értékek százaléka kell -nincs változás

(várható érték kiszámolása trükkös de rá lehet jönni -gyakorolni kell)

szabadságfokok számolása változik: (táblázat oszlopainak száma-1) * (táblázat soraink száma-1)

(kis p érték ugyanúgy azt jelenti, hogy valóságos az eltérés, el kell vetni a nullhipotézist hogy nem függ egymástól a két tényező)

Answer 97

A

két kísélret khi négyzet próba értékeit összeadom
-mind szabadságfokokat mind a khi négyzet értékeket

ez alapján megvizsgálom** **a balra fekvő területet ** a khi görbén

nullhipotézis: minden rendben
ellenhipotézis: várható értékek gyanúsan közel a megfigyelt értékekhez

ha kicsi a p-érték : khi értékeke az ellenhipotézist támasztják alá

Answer 98

A

. Amikor nagy a minta, olyankor a χ2
-próba nagyon jó modelleket is megcáfol.

Answer 99

A

pontdiagram

Answer 100

A

függő változó
független változó

független magyarázhatja a függőt

Answer 101

A

: az x koordináta növekedésével a pontok y koordinátái
is felfelé tendálnak

Answer 102

A

jelölése: R

A korrelációs együtthatóval mérhetjük a lineáris összefüggést, azaz a pontok tömörülését egy egyenes körül (szórásokhoz viszonytíva!) .

Ha a korrelációs együttható értéke közel van a +1-hez, akkor a két adathalmaz elemei között erős pozitív korreláció van: azaz, ha az egyik adatsor értéke nő, akkor a másik adatsor hozzá tartozó elemeinek értéke is nőni fog.

Ha a korrelációs együttható értéke közel van a -1-hez, akkor a két adathalmaz elemei között erős negatív korreláció van: azaz, ha az egyik adatsor értéke nő, akkor a másik adatsor hozzá tartozó elemeinek értéke csökkenni fog.

Ha a korrelációs együttható értéke közelít a nullához, akkor a két adathalmaz elemei között nincs lineáris kapcsolat.

Answer 103

A

: r = 0,80 nem azt jelenti, hogy a pontok 80%-a csoportosulna szorosan egy egyenes
körül, és azt sem, hogy kétszer annyira lenne lineáris a kapcsolat, mint r = 0,40 esetén.

Answer 104

A

a pontok egy lefelé menő egyenes körül tömörülnek

Answer 105

A

A korreláció két adathalmaz közötti kapcsolat nagyságát és irányát jellemzi.

A korreláció összefüggést mér. Az összefüggés azonban nem egyenlő az oksági kapcsolattal.

Answer 106

A

szórásegyenes: átmegy az átlagponton, és egy vízszintes szórásnyi
távolságon egy függőleges szórásnyit emelkedik. Rövidebben szólva, a meredeksége:
(y szórása) / (x szórása).
Ez érvényes pozitív összefüggés esetén. Ha a korrelációs együttható negatív, akkor az egyenes lefelé tart, a
meredeksége tehát:
- (y szórása) / (x szórása).

Answer 107

A

két változó standard egységre váltása szorzatának átlaga !

Answer 108

A

van

x változó: 5, 10, 3, 4, 7
y változó: 6, 7, 8, 9, 10

x változónak kiszámoljuk az átlagát
a szórását

majd:

5-átlag/szórás —–ezt végig csinálni az összes értékkel. az összes érték mellé írni x esetén

y átlagnál is megcsináljuk

(kettőt összeszorozni–szorzatok átlaga= korrelációs együttható)

Answer 109

A

-valószínűségi mintáknál a véletlen hiba valószínű nagyságát megadja a standard hiba

Answer 110

A

a változókat felcseréljük,

a változó minden értékéhez hozzáadjuk ugyanazt a számot,

a változó minden értékét megszorozzuk ugyanazzal a pozitív számmal.

(pl: csak olvasni- nem számít ha fahrenheitben vagy celsiusban írjuk le ugyanazokat a napokat, ugyanakkora lesz az R)

Answer 111

A

bemagolós mondat: A korrelációs együttható azt méri, hogy mennyire szorosan csoportosulnak a pontok egy egyenes köré, a szórásokhoz viszonyítva.

magyarázat:

A korrelációs együttható kiszámításakor standard egységre váltjuk át változóinkat: az átlagtól vett eltéréseket elosztjuk a szórással. Az r tehát a tömörülés szorosságát relatíve, a szórásokhoz viszonyítva méri, nem pedig abszolút számokban.

Answer 112

A

Az r a lineáris összefüggést méri, nem pedig az összefüggést általában véve.

Ha 1, előfordulnak kiugró értékek, vagy 2, ha az összefüggés nemlineáris, a korrelációs együttható félrevezető lehet.

Answer 113

A

Egy ökológiai korreláció arányszámokon vagy átlagokon alapul. A politikatudományban és a szociológiában gyakran használnak ilyeneket. Az ökológiai korreláció jellemzően eltúlozza az összefüggés erősségét.

Az arányszámok vagy átlagok alapján nyert korreláció félrevezető lehet (ha adatokat átlaggal jellemzünk, akkor figyelmen kívül hagyjuk a szóródást az átlag körül).

Answer 114

A

Kisiskolások körében az olvasási készség erősen korrelál a cipőmérettel. Új szavak megtanulástól azonban nem lesz nagyobb az ember lába. Inkább egy harmadik tényező játszik itt szerepet—az életkor. Ahogy idősebb lesz a gyerek, egyre jobban megtanul olvasni, és sorra növi ki a cipőit is. (A 2. fejezetben használt statisztikai zsargon szerint összemosó tényező itt az életkor.) Ennél a példánál könnyű volt megtalálni az összefüggést összekuszáló változót. De nem mindig ilyen egyszerű a helyzet. A korrelációs együttható kiszámítási eljárása nem nyújt védelmet ilyen releváns harmadik változókkal szemben.[5]

Answer 115

A

A regressziószámítás azt írja le, hogy hogyan is függ az egyik változó a másiktól.

Az x egy szórásnyi növekedéséhez az y értékeknek csak r szórásnyi növekedése társul. Ha ábrázoljuk ezt a regressziós becslést, megkapjuk y x-re vonatkozó regressziós egyenesét.

Answer 116

A

Nemlineáris összefüggés. Nem használható a regressziós egyenes akkor, amikor a változók közötti összefüggés nem egyenesen arányos (azaz nem lineáris).

Answer 117

A

Az átlagdiagram sokszor egy egyeneshez közelít, bár kissé hepehupás lehet. A regressziós egyenes kisimítja az egyenetlenségeket. Ha az átlagok egy vonalba esnek, akkor ez a vonal a regressziós egyenes.