Stat subset Flashcards
szignifikanciapróba? -miért van rá szükség és alapgondolat mögötte?
Egy szignifikanciapróba azzal a kérdéssel foglalkozik, hogy valóságos-e a megfigyelt eltérés (ez az ellenhipotézis), vagy pusztán véletlen ingadozás (ez a nullhipotézis).
Az az alapgondolatuk, hogy ha egy megfigyelt érték túl sok standard
hibányira esik a várható értékétől, azt nehéz véletlennel magyarázni.
null- és ellenhipotézis fogalmak?
A nullhipotézis azt az elgondolást fejezi ki, hogy a megfigyelt eltérést (a várható és a megfigyelt érték között) a véletlen okozza.
Az ellenhipotézis ennek ellenkezőjét állítja.
próbastatisztika fogalma?
A próbastatisztika arra való, hogy mérje, mennyire térnek el az adatok a nullhipotézis alapján várható értéktől.
Z próba statisztika képlet és mit mutat meg?
= megfigyelt érték- várható érték
__________________________________
standard hiba
A z azt mondja meg, hogy a megfigyelt érték hány standard hibányira esik a nullhipotézis alapján kiszámolt várható értéktől.
meg kell ijedni ha T vagy Z próbánál nincs szórás megadva?
nem simán kiszámolom
megnézem az átlagot és stb
mi a P-érték és mi a másik neve?
A megfigyelt szignifikanciaszint (P-nek vagy P-értéknek is nevezik) annak a valószínűsége, hogy annyira
szélsőséges próbastatisztikát kapunk, mint amilyet megfigyeltünk, vagy még szélsőségesebbet. Kiszámításakor
úgy számolunk, mintha a nullhipotézis igaz lenne. Tehát a P nem azt mondja meg, hogy milyen valószínűséggel
igaz a nullhipotézis.
P-érték értelmezése?
Természetesen adódik a kérdés, mennyire kell kicsinek lennie a megfigyelt szignifikanciaszintnek ahhoz, hogy a
kutató elvethesse a nullhipotézist. Sok statisztikus 5%-nál húzza meg a határt.
* Ha P kisebb 5%-nál, akkor statisztikailag szignifikáns-nak nevezzük az eredményt.
Egy másik határvonal is van, 1%-nál.
* Ha P kisebb 1%-nál, akkor az eredmény erősen szignifikáns.
Hogyan áll össze egy szignifikanciapróba?-lépései -easy
- meg kell fogalmaznunk a nullhipotézist; ez egy, az adatokra vonatkozó dobozmodell lesz;
- ki kell választanunk egy alkalmas próbastatisztikát – ezzel fogjuk mérni, mennyire térnek el az adatok a
nullhipotézis alapján várhatótól; - ki kell számítanunk a megfigyelt szignifikanciaszintet, azaz P-t.
mikor használok z próba helyett t próbát?
kis minták esetén
pl van négy vagy 5 mérésem
egy mérés esetén csinálhatok t próbát?
nem
mikor használunk Student görbét és mikor normálgörbét?
Student-görbét akkor használunk, ha
* Olyanok az adatok, mintha egy dobozból végeznénk húzásokat.
* Nem ismerjük a doboz szórását.
* A megfigyelések száma kicsi, emiatt a doboz szórását nem tudjuk igazán pontosan megbecsülni.
* A dobozban lévő számokra vonatkozó hisztogram nem sokkal tér el a normálgörbétől.
Nagyobb számú megfigyelés esetén (mondjuk 25 fölött) rendszerint a normálgörbét használjuk. Ha ismerjük a
doboz szórását és ha a dobozbeli számok a normálgörbét követik, akkor kis mintáknál is használhatjuk a
normálgörbét.
ha kis mintám van (ergó T próbát készítek) akkor mi változik a próba képletén a Z próbához képest?
Z próba így nézett ki:
megfigyelt érték - várható érték
____________________________
standard hiba
standard hiba kiszámítása változik
standard hiba egyébként = gyök alatt:mérések/húzások száma * szórás
**itt mi változik: szórás **
szórás = korrigált szórás * szórás
korrigált szórás =
ha mérések száma = 4
gyök alatt minden
mérések száma
________________ * szórás
mérések száma - 1
Feladat:
Igaz vagy hamis:
e. Ha z=2,3, akkor a megfigyelt érték 2,3 standard hibányival fölötte van a nullhipotézis alapján várt értéknek.
igaz
magyarázat:
Igaz; z=(megfigyelt – várható)/standard hiba; “várható”-t a nullhipotézis alapján számolva.
képlet arra, hogy két mintaátlag közötti eltérés standard hibáját hogyan számoljuk ki?
Két független mennyiség eltérésének standard hibája
gyök alatt
a^2 + b^2
• a az első mennyiség standard hibája;
• b a második mennyiség standard hibája.
kétmintás z próba mit jelent? képlet változik bármit?
arra keressük a választ, hogy két minta értékei közötti eltérés magyarázható-e véletlen ingadozással vagy sem
képlet: **(csak alul változik) **
megfigyelt érték - várható érték(régebbi)
___________________
st hiba **(két érték közötti eltérés!! stb hibája) **
kétmintás z próba kiszámításához mit kell ismerni?
- a két mintaelemszámot,
- a két mintaátlagot,
- a két minta szórását.
A próba két **független, egyszerű véletlen **mintára alkalmazható.
Általában hibás eredményt kapunk, ha a
képleteket összefüggő mintákra alkalmazzuk. Van kivétel: használhatjuk a z-próbát arra, hogy a kezelt és a
kontrollcsoportot egy sorsolt kontrollú kísérletben összehasonlítsuk – még olyankor is, amikor a csoportok
összefüggenek
- “Puszta véletlen okozza a két mintaátlag közötti különbséget?” E kérdés megválaszolásához a statisztikusok a
________________ z-próbát használják. Töltse ki az üresen hagyott helyet, és röviden indokoljon.
kétmintás
NAGYON TUDNI : lehet használni kétmintás z próbát annak ellenére ha sorsolt kontrollú kísérleteknél a minták nem függetlenek?
bár a minták nem függetlenek lehet
mondtuk hogy kétmintás z próbát lehet végezni úgy, hogy sorsolt kontrollú kísérletekről van szó, melyek mintái összefüggenek, hogyan kell a st hibát számtíani? van spec szabály?
visszatevéses st hibát kell számítani akkoris ha visszatétel nélkül történt a mintavétel!
sokat számít, hogy a p-érték 4,9 vagy 5,1 % valóságban?
nem
csak az 5% az aminél a többség meghúzza a határt
lehet olyan helyzet hogy a p-érték szignifikáns eredményt jelez, de valóságban nem sokat számít a vizsgált eltérés
1% alatti p -érték nem jelzi azt hogy mindenesetben sokat nyom latba az eltérés amit észrevettünk lehet gyakorlati jelentősége nincs
mikor használunk egyoldalú próbát és mikor kétoldalút?
Az egyoldalú próba akkor alkalmazandó, amikor a becsült érték a referenciaértéktől csak egy irányban térhet el
Kétoldalú: a becsült érték lehet nagyobb és kisebb is, mint a referenciaérték
Igaz vagy hamis? Ha egy eredmény statisztikailag szignifikáns, az azt jelenti, hogy mindössze 100-ból 5 az esélye annak, hogy
ez az eredmény véletlen, míg 100-ból 95 annak, hogy valóságos.
Hamis
khi négyzet próba mire való? -képlet?
a várható és a megfigyelt gyakoriságok
közötti távolságot méri.
X^2(khi négyzet) = (megfigyelt gyakoriság - várható gyak)^2
————————-
várható gyak
magas khi érték: távol esnek a gyakoriságok
alacsony: megfigyelt gyakoriságok a várhatóak közelében maradnak
megértéséhez példa: megakartuk figyelni hogy gyanúsan sokszor jön-e ki valami érték
0-1 dobozmodell felállítása- pl ha két kategória van-
1, bejön a tipp 2, nem jön be a tipp
megnézzük melyiknek mekkora az esélye (1/6 vagy ilyesmi)
de: dobókocka pl hogyan tudjuk meg hogy szabályos vagy megcinkelték?
van hat kategória - nem állíthatok fel dobozmodellt- kell a khi próba
Mikor kell z-próba helyett inkább χ2
-próbát használni?
(Ha számít, hogy melyik fajta lapból hány van a
dobozban, a χ
2
-próba a jó; ha viszont csak a doboz átlaga számít, dolgozzunk z-próbával.)
- A χ2
-próba megmondja, hogy adataink olyanok-e, mintha egy adott összetételű dobozból végeztünk volna
véletlen húzásokat. - A z-próba megmondja, hogy adataink olyanok-e, mintha egy adott átlagú dobozból végeztünk volna véletlen
húzásokat.
pl ha dobóckokcán khi próbázunk akkor mindegyik 1-6-ig lévő számnak ugyanakoora esélye van a kijövésre, tehát 10 mindenhol a várható gyakoriság
khi próba nevezőjében is 10 van (nem hatszor 10, vagy 100)
de ha különbözőek nagyon a gyakoriságok akkor mi van a nevezőben?
várható gyakoriságok átlaga
p-értéket hogyan állapítjuk meg a khi négyzet próbánál? (standard eset)
képlet alapján megkapjuk a khi értéket
megnézzük a szabadságfokokat (nem függetlenségvizgsálat esetében) : összeadandó törtek khi képletben - 1
szabadságfokok táblázatban- jobboldalra fekvő értékek %át jelzi a fenti szám
a khi négyzet próbát mire lehet még használni ( és mi változik számolás közben)-csak magam miatt megjegyezni ?
függetlenségvizsgálat
(pl: befolyásolja-e a jobb vagy balkezességet hogy nő vagy férfi vagy)
p érték ugyanúgy jobbra fekvő értékek százaléka kell -nincs változás
(várható érték kiszámolása trükkös de rá lehet jönni -gyakorolni kell)
szabadságfokok számolása változik: (táblázat oszlopainak száma-1) * (táblázat soraink száma-1)
(kis p érték ugyanúgy azt jelenti, hogy valóságos az eltérés, el kell vetni a nullhipotézist hogy nem függ egymástól a két tényező)
ha kíváncsi vagyok arra hogy egy kutató több kutatása során kozmetikázza eredményeit és a várható gyakoriságok mágikusan mindig közel vannak nagyon a megfigyelt gyakoriságokhoz hogyan vizsgálódhatok?
két kísélret khi négyzet próba értékeit összeadom
-mind szabadságfokokat mind a khi négyzet értékeket
ez alapján megvizsgálom** **a balra fekvő területet ** a khi görbén
nullhipotézis: minden rendben
ellenhipotézis: várható értékek gyanúsan közel a megfigyelt értékekhez
ha kicsi a p-érték : khi értékeke az ellenhipotézist támasztják alá
khi négyzet próba eredményét befolyásolja, hogy mekkora a minta?
. Amikor nagy a minta, olyankor a χ2
-próba nagyon jó modelleket is megcáfol.
khi négyzet próba feltételei?
- A változók függetlensége
- Az elvárt gyakoriság a kontingencia táblázat minden cellájában öt felett van