Stat subset vége Flashcards
Tudni
mi a korreláció?
vizsgakieginfó: mit nem mutat meg és mit igen?
A korreláció két adathalmaz közötti kapcsolat nagyságát és irányát jellemzi.
A korreláció összefüggést mér. Az összefüggés azonban nem egyenlő az oksági kapcsolattal.
Tudni
korrelációs együttható basic infók?
jelölése: R
A korrelációs együtthatóval mérhetjük a lineáris összefüggést, azaz a pontok tömörülését egy egyenes körül (szórásokhoz viszonyítva!) .
Ha a korrelációs együttható értéke közel van a +1-hez, akkor a két adathalmaz elemei között erős pozitív korreláció van: azaz, ha az egyik adatsor értéke nő, akkor a másik adatsor hozzá tartozó elemeinek értéke is nőni fog.
Ha a korrelációs együttható értéke közel van a -1-hez, akkor a két adathalmaz elemei között erős negatív korreláció van: azaz, ha az egyik adatsor értéke nő, akkor a másik adatsor hozzá tartozó elemeinek értéke csökkenni fog.
Ha a korrelációs együttható értéke közelít a nullához, akkor a két adathalmaz elemei között nincs lineáris kapcsolat.
mit jelent a negatív összefüggés korrelációvizsgálatnál pontdiagrammon?
a pontok egy lefelé menő egyenes körül tömörülnek
Tudni
korrelációvizsgálatot mivel jelenítjük meg grafikusan?
pontdiagram
Tudni
korrelációvizsgálat során két változó neve?
függő változó
független változó
független magyarázhatja a függőt
mit jelent a korrelációvizsgálatnál pontdiagrammon a pozitív összefüggés?
: az x koordináta növekedésével a pontok y koordinátái
is felfelé tendálnak
csak olvasni:
: r = 0,80 nem azt jelenti, hogy a pontok 80%-a csoportosulna szorosan egy egyenes
körül, és azt sem, hogy kétszer annyira lenne lineáris a kapcsolat, mint r = 0,40 esetén.
elég csak olvasni szerintem, de kb azért memorizálhatom:
szórásegyenes
szórásegyenes: átmegy az átlagponton, és egy vízszintes szórásnyi
távolságon egy függőleges szórásnyit emelkedik. Rövidebben szólva, a meredeksége:
(y szórása) / (x szórása).
Ez érvényes pozitív összefüggés esetén. Ha a korrelációs együttható negatív, akkor az egyenes lefelé tart, a
meredeksége tehát:
- (y szórása) / (x szórása).
Tudni
hogyan kell korrelációs együtthatót kiszámolni?
két változó standard egységre váltása szorzatának átlaga !
hogyan kell standard egységet számolni?
van
x változó: 5, 10, 3, 4, 7
y változó: 6, 7, 8, 9, 10
x változónak kiszámoljuk az átlagát
a szórását
majd:
5-átlag/szórás —–ezt végig csinálni az összes értékkel. az összes érték mellé írni x esetén
y átlagnál is megcsináljuk
(kettőt összeszorozni–szorzatok átlaga= korrelációs együttható)
Tudni
a korrelációs együtthatót nem befolyásolja ha:
a változókat felcseréljük,
a változó minden értékéhez hozzáadjuk ugyanazt a számot,
a változó minden értékét megszorozzuk ugyanazzal a pozitív számmal.
(pl: csak olvasni- nem számít ha fahrenheitben vagy celsiusban írjuk le ugyanazokat a napokat, ugyanakkora lesz az R)
Tudni
hogyan lehetséges az, hogy van két pontdiagram ugyanakkora R-rel de a szórásegyeneshez az egyik pontrdiagram értékei sokkal közelebb vannak, mint a másik értékei?
bemagolós mondat: A korrelációs együttható azt méri, hogy mennyire szorosan csoportosulnak a pontok egy egyenes köré, a szórásokhoz viszonyítva.
magyarázat:
A korrelációs együttható kiszámításakor standard egységre váltjuk át változóinkat: az átlagtól vett eltéréseket elosztjuk a szórással. Az r tehát a tömörülés szorosságát relatíve, a szórásokhoz viszonyítva méri, nem pedig abszolút számokban.
Tudni
mikor nem lehet a korrelációs együtthatót használni?
Az r a lineáris összefüggést méri, nem pedig az összefüggést általában véve.
Ha 1, előfordulnak kiugró értékek, vagy 2, ha az összefüggés nemlineáris, a korrelációs együttható félrevezető lehet.
Tudni
mi az ökológiai korreláció mi szokott vele a gond lenni?
Egy ökológiai korreláció arányszámokon vagy átlagokon alapul. A politikatudományban és a szociológiában gyakran használnak ilyeneket. Az ökológiai korreláció jellemzően eltúlozza az összefüggés erősségét.
Az arányszámok vagy átlagok alapján nyert korreláció félrevezető lehet (ha adatokat átlaggal jellemzünk, akkor figyelmen kívül hagyjuk a szóródást az átlag körül).
Korreláció 2 fő fajtája?
Pearson korrelációt akkor végzünk, ha mind a függő, mind a független változóink paraméteresek
Spearman korrelációt pedig akkor, ha valamelyik változó (vagy mindegyik) nem paraméteres
csak megérteni példa arra hogy a korreláció nem jelent oksági kapcsolatot!
Kisiskolások körében az olvasási készség erősen korrelál a cipőmérettel. Új szavak megtanulástól azonban nem lesz nagyobb az ember lába. Inkább egy harmadik tényező játszik itt szerepet—az életkor. Ahogy idősebb lesz a gyerek, egyre jobban megtanul olvasni, és sorra növi ki a cipőit is. (A 2. fejezetben használt statisztikai zsargon szerint összemosó tényező itt az életkor.) Ennél a példánál könnyű volt megtalálni az összefüggést összekuszáló változót. De nem mindig ilyen egyszerű a helyzet. A korrelációs együttható kiszámítási eljárása nem nyújt védelmet ilyen releváns harmadik változókkal szemben.[5]
Tudni:
Mi a regresszió?
Galton nevéhez kötjük a regressziószámítás alapjait
A regressziószámítással azt határozhatjuk meg, hogy egy vagy több független változó milyen mértékben befolyásolhat egy függő változót.
Ha két folytonos változó lineáris kapcsolatban van egymással, akkor az egyik segítségével előre jelezhetjük a másik értékét.
Ha az előrejelzés egy változó segítségével történik, akkor egyváltozós lineáris regresszió számításnak nevezzük az eljárást.
Ha az előrejelzés több változó segítségével történik, akkor többváltozós lineáris regresszió számításnak nevezzük az eljárást.