Stat subset vége Flashcards

1
Q

Tudni

mi a korreláció?

vizsgakieginfó: mit nem mutat meg és mit igen?

A

A korreláció két adathalmaz közötti kapcsolat nagyságát és irányát jellemzi.

A korreláció összefüggést mér. Az összefüggés azonban nem egyenlő az oksági kapcsolattal.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Tudni

korrelációs együttható basic infók?

A

jelölése: R

A korrelációs együtthatóval mérhetjük a lineáris összefüggést, azaz a pontok tömörülését egy egyenes körül (szórásokhoz viszonyítva!) .

Ha a korrelációs együttható értéke közel van a +1-hez, akkor a két adathalmaz elemei között erős pozitív korreláció van: azaz, ha az egyik adatsor értéke nő, akkor a másik adatsor hozzá tartozó elemeinek értéke is nőni fog.

Ha a korrelációs együttható értéke közel van a -1-hez, akkor a két adathalmaz elemei között erős negatív korreláció van: azaz, ha az egyik adatsor értéke nő, akkor a másik adatsor hozzá tartozó elemeinek értéke csökkenni fog.

Ha a korrelációs együttható értéke közelít a nullához, akkor a két adathalmaz elemei között nincs lineáris kapcsolat.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

mit jelent a negatív összefüggés korrelációvizsgálatnál pontdiagrammon?

A

a pontok egy lefelé menő egyenes körül tömörülnek

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Tudni

korrelációvizsgálatot mivel jelenítjük meg grafikusan?

A

pontdiagram

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Tudni

korrelációvizsgálat során két változó neve?

A

függő változó
független változó

független magyarázhatja a függőt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

mit jelent a korrelációvizsgálatnál pontdiagrammon a pozitív összefüggés?

A

: az x koordináta növekedésével a pontok y koordinátái
is felfelé tendálnak

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

csak olvasni:

A

: r = 0,80 nem azt jelenti, hogy a pontok 80%-a csoportosulna szorosan egy egyenes
körül, és azt sem, hogy kétszer annyira lenne lineáris a kapcsolat, mint r = 0,40 esetén.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

elég csak olvasni szerintem, de kb azért memorizálhatom:

szórásegyenes

A

szórásegyenes: átmegy az átlagponton, és egy vízszintes szórásnyi
távolságon egy függőleges szórásnyit emelkedik. Rövidebben szólva, a meredeksége:
(y szórása) / (x szórása).
Ez érvényes pozitív összefüggés esetén. Ha a korrelációs együttható negatív, akkor az egyenes lefelé tart, a
meredeksége tehát:
- (y szórása) / (x szórása).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Tudni

hogyan kell korrelációs együtthatót kiszámolni?

A

két változó standard egységre váltása szorzatának átlaga !

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

hogyan kell standard egységet számolni?

A

van

x változó: 5, 10, 3, 4, 7
y változó: 6, 7, 8, 9, 10

x változónak kiszámoljuk az átlagát
a szórását

majd:

5-átlag/szórás —–ezt végig csinálni az összes értékkel. az összes érték mellé írni x esetén

y átlagnál is megcsináljuk

(kettőt összeszorozni–szorzatok átlaga= korrelációs együttható)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Tudni

a korrelációs együtthatót nem befolyásolja ha:

A

a változókat felcseréljük,

a változó minden értékéhez hozzáadjuk ugyanazt a számot,

a változó minden értékét megszorozzuk ugyanazzal a pozitív számmal.

(pl: csak olvasni- nem számít ha fahrenheitben vagy celsiusban írjuk le ugyanazokat a napokat, ugyanakkora lesz az R)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Tudni

hogyan lehetséges az, hogy van két pontdiagram ugyanakkora R-rel de a szórásegyeneshez az egyik pontrdiagram értékei sokkal közelebb vannak, mint a másik értékei?

A

bemagolós mondat: A korrelációs együttható azt méri, hogy mennyire szorosan csoportosulnak a pontok egy egyenes köré, a szórásokhoz viszonyítva.

magyarázat:

A korrelációs együttható kiszámításakor standard egységre váltjuk át változóinkat: az átlagtól vett eltéréseket elosztjuk a szórással. Az r tehát a tömörülés szorosságát relatíve, a szórásokhoz viszonyítva méri, nem pedig abszolút számokban.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Tudni

mikor nem lehet a korrelációs együtthatót használni?

A

Az r a lineáris összefüggést méri, nem pedig az összefüggést általában véve.

Ha 1, előfordulnak kiugró értékek, vagy 2, ha az összefüggés nemlineáris, a korrelációs együttható félrevezető lehet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Tudni

mi az ökológiai korreláció mi szokott vele a gond lenni?

A

Egy ökológiai korreláció arányszámokon vagy átlagokon alapul. A politikatudományban és a szociológiában gyakran használnak ilyeneket. Az ökológiai korreláció jellemzően eltúlozza az összefüggés erősségét.

Az arányszámok vagy átlagok alapján nyert korreláció félrevezető lehet (ha adatokat átlaggal jellemzünk, akkor figyelmen kívül hagyjuk a szóródást az átlag körül).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Korreláció 2 fő fajtája?

A

Pearson korrelációt akkor végzünk, ha mind a függő, mind a független változóink paraméteresek

Spearman korrelációt pedig akkor, ha valamelyik változó (vagy mindegyik) nem paraméteres

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

csak megérteni példa arra hogy a korreláció nem jelent oksági kapcsolatot!

A

Kisiskolások körében az olvasási készség erősen korrelál a cipőmérettel. Új szavak megtanulástól azonban nem lesz nagyobb az ember lába. Inkább egy harmadik tényező játszik itt szerepet—az életkor. Ahogy idősebb lesz a gyerek, egyre jobban megtanul olvasni, és sorra növi ki a cipőit is. (A 2. fejezetben használt statisztikai zsargon szerint összemosó tényező itt az életkor.) Ennél a példánál könnyű volt megtalálni az összefüggést összekuszáló változót. De nem mindig ilyen egyszerű a helyzet. A korrelációs együttható kiszámítási eljárása nem nyújt védelmet ilyen releváns harmadik változókkal szemben.[5]

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Tudni:

Mi a regresszió?

A

Galton nevéhez kötjük a regressziószámítás alapjait

A regressziószámítással azt határozhatjuk meg, hogy egy vagy több független változó milyen mértékben befolyásolhat egy függő változót.

Ha két folytonos változó lineáris kapcsolatban van egymással, akkor az egyik segítségével előre jelezhetjük a másik értékét.

Ha az előrejelzés egy változó segítségével történik, akkor egyváltozós lineáris regresszió számításnak nevezzük az eljárást.

Ha az előrejelzés több változó segítségével történik, akkor többváltozós lineáris regresszió számításnak nevezzük az eljárást.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Előrejelzés pontossága szerint kétféle kapcsolatról szokás beszélni regressziónál?

A

Függvénykapcsolatról van szó ha: a regresszió tökéletes előrejelzésre ad lehetőséget

Statisztikai kapcsolatról van szó ha az előrjelzés nem tökéletes (megfigyelt értékek nem illeszkednek tökéletesen az egyenesre)

19
Q

mikor nem használható a regressziós egyenes?

A

Nemlineáris összefüggés- a változók közötti összefüggés nem lineáris.

De több eset van, amikor ha az összefüggés még lineáris is, nincs értelme a regressziós egyenesnek- más faktornak van magyarázóereje amiről nem tudunk stb

20
Q

csak magamnak megtanulni: átlagdiagram vs regsszióegyenes?

A

Az átlagdiagram sokszor egy egyeneshez közelít, bár kissé hepehupás lehet. A regressziós egyenes kisimítja az egyenetlenségeket. Ha az átlagok egy vonalba esnek, akkor ez a vonal a regressziós egyenes.

21
Q

Hogyan kapjuk meg a regressziós egyenest?

A

Az x egy szórásnyi növekedéséhez az y értékeknek csak r szórásnyi növekedése társul átlagosan. Ha ábrázoljuk ezt a regressziós becslést, megkapjuk y x-re vonatkozó regressziós egyenesét

22
Q

mi a regressziós effektus?

A

Galton vette észre elsőként

ezt a jelenséget azzal írta le, hogy “visszatérés a középszerűséghez”

tételezzük fel, hogy diákok tesztpontszámait látjuk egy egy pontdiagrammon

a regresszió effektus az, hogy az első teszten kiemelkedően jól teljesítő diákok pontszáma a második teszten valamelyest visszaesést fog mutatni

míg egy az első teszten legrosszabbul szerepelő diákok a második teszten már valamivel jobban fognak teljesíteni

23
Q

mi a regressziós tévkövetkeztetés?

A

a regressziós effektus nem egy természetes jelenség, hanem valaminek az okozata

24
Q

csak olvasni:

A

ezt a két regressziós egyenes van fejezetet halálra gyakorolni este!!!!!!

25
Q

mit nevezünk reziduálisnak vagy előrejelzési hibának? 2 infó!!

A

regresszió esetében a tényleges érték és az előre jelzett érték közötti különbséget

grafikus megfelelője a pontdiagramon az a függőleges távolság, amennyivel a pont az egyenes fölött vagy alatt van.

reziduálisok átlaga 0

26
Q

négyzetes középhiba?

A

A regressziós egyenes négyzetes középhibája megmondja, hogy egy tipikus pont mennyivel van a regressziós egyenes fölött vagy alatt.

Sok pontdiagramra teljesül, hogy az előrejelzések körülbelül 68%-a helyes lesz egy négyzetes középhibányi tartományon belül; 95%-uk pedig két négyzetes középhibányi tartományon belül.

27
Q

csak olvasgatni: Y szórás

A

Az y szórása kifejezi, hogy milyen messze van egy tipikus pont az y átlagán átmenő vízszintes egyenestől (fölfelé vagy lefelé). Más szavakkal, y szórása annak az eljárásnak a négyzetes középhibája, amikor az y értékekre – x értékét figyelmen kívül hagyva – az y átlagával adunk előrejelzést.

28
Q

négyzetes középhiba kiszámolása és mértékegysége?

A

gyök alatt:
1-korrelációs együttható^2
x szórás -azé a változóé, melyre előrejlezést adunk

mértékegysége megegyezik annak a változónak a mértékegységével, amelyre az előrejelzést adjuk.

29
Q

csak olvasgatni: négyzetes középhiba vs extrapolálás?

A

Ha valaki az adatok tartományán kívülre extrapolál, vagy a vizsgálatban szereplő személyektől eltérő embercsoportra akar az egyenes segítségével becslést adni, akkor a négyzetes középhibából nem tudhatja meg a tévedés valószínűsíthető mértékét.

30
Q

reziduálisok diagramja mikor van rendben? és mikor mutatja azt a reziduálisok digramja hogy hiba a volt regressziós egyenest használni?

A

helyes: semmilyen tendencia nincs rajta
nem helyes: minden más

31
Q

mikor homoszkedasztikus egy pontdiagram és mit jelent ez a négyzetes középhiba alkalmazására nézve?

A
  • a pontdiagram olyan, hogy minden függőleges sávban hasonló mértékű a szóródás

(=rögbilabda alak)

  • az előrejelzési hiba az egész regressziós egyenes mentén hasonló mértékű
  • négyzetes középhiba értelmezhető —-heteroszkedasztikus diagrammok esetén sávokra nem
32
Q

regressziós egyenes ábrázolása?

A

A regressziós egyenest ábrázolni lehet a tengelymetszet és a meredekség alapján.

Meredekség:
r · (y szórása) / (x szórása).

A regressziós egyenes tengelymetszete az y-ra adott előrejelzésünk x = 0 esetén

33
Q

kontrollált kísérlet és megfigyeléses vizsgálatok esetén hogyan kell értelmezni a regressziós egyeneset?

A

Kontrollált kísérlet esetén a meredekségből megtudjuk, hogy átlagosan mekkora változást okoz y-ban az x megváltozása. Megfigyeléses vizsgálatnál azonban nem bízhatunk a meredekségben valamely beavatkozás eredményének előrejelzéseként. Megfigyeléses adatokból oksági jellegű következtetéseket levonni sok fáradságos munkát igényel – akár regressziószámítással, akár más módon

34
Q

csak olvasni -de meg kell érteni:

A

A terheletlen rugó hosszára 439,01 cm adódott legkisebb négyzetes becslésként, mely parányival nagyobb a terhelés nélkül mért hossznál (439,00 cm). Egy statisztikus ilyenkor jobban bízik a legkisebb négyzetes becslésben, mint a mérésben. Miért is? Azért, mert a becslés felhasználja mind a hat mérési eredményt, és nem csupán egyet – a mérési hiba egy része valószínűleg kiesett.

35
Q

csak kb: Hooke-törvény? (Freedman felhozta példának)

A

a megnyúlás egyenesen arányos a terheléssel

csak bizonyos anyagokra és bizonyos terhelési feltételek mellett érvényes

36
Q

legkisebb négyzetek módszere?

A

a legkisebb négyzetek módszere azt az egyenest keresi meg, amelyre igaz az, hogy ha a pontoknak az egyenestől mért távolságait négyzetre emeljük, majd a kapott számokat összegezzük, akkor ez az összeg minimális lesz

Az az y = mx + b egyenes, amely megfelel ennek a követelménynek: a regressziós egyenes

legkisebb négyzetes becslésnél:
m: meredekség
b: tengelymetszet

37
Q

Közvéleménykutatás lehetséges hibáinak két fajtája-ELSŐ?

Így kezdődik a tétel! Megbízhatóság és érvényesség

A

mintavételi hibák

egyik lehetséges fajtája: nem a teljes sokaságot kérdezem meg hanem mintát veszek

rossz mintaválasztás

minta nagysága problémás

38
Q

Közvéleménykutatás- hibák második kategóriája?

A

nem mintavételi hiba:

abból ered, hogy: az emberek véleményét mindig csak korlátozott mértékben lehet megismerni

39
Q

közvélemánykutatás hibáiról összegezve azt lehet mondani, hogy…

A

A mintavételi hibák a megbízhatóságot, a nem mintavételi hibák az érvényességet csökkentik.

A közkut eredményeinek teljes hibája a mintavételi és nem mintavételi hibáknak az eredője, de ez nem feltétlenül jelent egyszerű összeadást. Néha a mintavételi és nem mintavételi hibák kioltják egymást, hiszen mindkét hiba lehet pozitív és negatív is

Mindenesetre a teljes hiba nem lehet nagyobb, mint a mintavételi és nem mintavételi hiba (abszolút értékének) összege.

40
Q

mit jelent közvéleménykutatásnál a megbízhatóság?

A

Egy közkut annál megbízhatóbb, minél kevésbé esetleges az eredménye.

Ez azt jelenti, hogy ha a vizsgálatot azonos módszereket alkalmazva megismételnék (a mintavételtől kezdve), akkor mennyire kapnának más eredményeket.

Minél eltérőbbek lennének az eredmények az eredetitől annál kevésbé megbízható a közkut.

probléma: valóságban nagyon ritkán lehet ugyanolyan körülmények között megismételni egy közkut-ot

41
Q

közvélemény-kutatás érvényessége?

A

a kapott válaszok tényleg arra vonatkoznak, amiről a közvélemény-kutatás szól.

akadályok lehetnek:
-emberek határozatlanok
-az emberek nyilatkozzák, hogy valamit megtesznek de végül eszük ágában sem lesz

de csökkenthető hibák- akadályok:
-a feltett kérdések pontatlanok
-nehezen értelmezhetőek

42
Q

mintavételi hiba csökkentésére módszerek ? (és ezzel megbízhatóság növelése)

A

-a gondos mintaválasztással
-a megfelelő mintanagysággal
-a minta minél nagyobb hányadának tényleges lekérdezésével lehet

43
Q

nem mintavételi hibák csökkentése- ezzel érvényesség növelése?

A

-kérdezés helyes módjának megválasztása
-a kérdőív megfelelő szerkesztése
- a kérdezőbiztosok alapos kiképzése és ellenőrzése lehet.

44
Q

milyen adatokat közöl egy fair közvélemény kutató szervezet?

=milyen egy helyes közvéleménykutatási beszámoló ?

A

A mintanagyságot, a mintaválasztás módját, a nemválaszolók arányát a legtöbb vizsgálatról szóló beszámoló közli.

Arról pedig, hogy kik voltak a kérdezőbiztosok, milyen képzésen vettek részt, hogyan ellenőrizték a munkájukat, hogyan biztosították például azt, hogy nagyjából hasonlóan legyenek öltözve, vagy volt-e lényeges eltérés korban vagy képzettségben közöttük, szinte soha nem tudunk meg semmit.