VŠA Flashcards
Definuj viacrozmerné metódy
Metóda analýzy závislostí, metódy skrytých vzťahov, klasifikačné metódy
Definuj metódy analýzy závislostí
RaKA a DA. Premenné možno rozdeliť na závislé/nezávislé. Cieľom je nájsť ako vplývajú nezávislé premenné na závisle premennú
Definuj metódy skrytých vzťahov
PCA a FA. Premenné nemožno rozdeliť na závislé/nezávislé. Ak sa medzi premennými nachádza multikolinearita, teda sú premenné na seba navzájom korelované, tak ide také isté množstvo informácie vysvetliť aj menším počtom premenných. Ich hlavná úloha je vytvoriť premenné, ktoré nie sú korelované a ktoré vysvetľujú čo najvyšši rozptyl
Definuj klasifikačné metódy
ZA a DA. Ich cieľom nie je sledovať premenné ale objekty, pričom podobné objekty zgrupiť do skupín na základe spoločných znakov čo najlepšie
Opíš PCA metódu
Metóda skrytých vzťahov. Ordinálna metóda, ktorá umožňuje redukovať počet dimenzií v Euklidovskom priestore tak, aby došlo k čo najmenšej strate informácie. Premenné nie sú rozdelené na závislé a nezávislé. Podmienkou jej použitia je výskyt silnej multikolinearity medzi premennými. Nové premenné, ktoré sú definované PCA sa nazývajú HK, ktoré sú nekorelované
Typy PCA
Centrovaná - Vychádza z kovariačnej matice - začiatočný bod sa presúva z pôvodného bodu do centroidu objektu.
Štandardizovaná - vychádza z korelačnej matice - Začiatočný bod sa presúva z pôvodného bodu do centroidu objektu, pričom sú pôvodné hodnoty normované (ich rozptyl je 1)
Necentrovaná - Vychádzame z pôvodného bodu, začiatočný bod sa nachádza v tom istom bode, ako bol na začiatku
Definuj komponentové skóre
Skóre jednotlivých objektov v novo definovanom priestore za pomoci nových premenných, HK
Definuj vlastné vektory
Vyjadrujú smer vektorov, ktoré charakterizujú vplyv pôvodných znakov na komponenty. Čísla vlastných vektorov predstavujú váhy jednotlivých premenných pri tvorbe príslušného komponentu
Definuj vlastné čísla
Vyjadrujú smer variability, ktorá je zachytená príslušným komponentom
Definuj FA
Metóda skrytých vzťahov určená na zjednodušenie štatistických analýz. Analyzuje sa štruktúra vzťahov medzi veľkou množinou premenných tak, aby bolo možné určiť spoločné faktory. FA vytvára novú premennú faktor, pričom pôvodné premenné sú lineárnou kombináciou daných faktorov
Typy faktorov
Spoločný faktor - latentná premenná, ktorá vysvetľuje najmenej 2 pôvodné premenné
Špecifický faktor - latentná hypotetická premenná, ktorá vysvetľuje len jednu pôvodnú premennú
Druhy FA
Prieskumná - nie je vopred určený žiaden možný vzťah o faktorovej štruktúre PP
Potvrdzujúca - Poznáme vopred určitú hypotézu o rozdelení faktorov, ktorú FA buď prijímeme alebo zamietneme
Postup realizácie FA
Vyber premenných, zistenie kolinearity medzi premennými a posúdenie vhodnosti dát na vykonanie FA (KMO), samotná FA, možná rotácia faktorov pri ťažkej interpretácii. Interpretácia výsledkov a faktorového skóre
Podobnosti FA a PCA
Metódy skrytých vzťahov, znižovania dimenzie. FA sa snaží vysvetliť kovariancie a korelácia pôvodných premenných pričom pri PCA je hlavným nositeľom informácie rozptyl
Definuj klasifikačné metódy
Metódy, pomocou ktorých už nesledujeme premenné ale jednotlivé objekty, pričom ich hlavnou úlohou je roztriediť objekty do skupín (zhlukov) tak, aby vnútrozhluková variabilita bola čo najnižšia a medzizhluková variabilita čo najväčšia
Definuj ZA
Cieľ je vytvoriť zhluky.
Aké sú miery podobnosti/nepodobnosti
Euklidovská metrika, Euklidovská štvorcová, Minkovského, Hammingova a Mahalanobisova
Čím je zaujímavá Mahalanobisova metrika?
Nevyžaduje nekorelované údaje
Aké poznáme zhlukovacie postupy?
Hierarchické a nehierarchické
Rozdiel medzi hierarchickými a nehrierachickými postupmi?
Pri hierarhických dochádza k spájaniu/rozpájaniu zhlukov na každom kroku
Aké poznáme hierarchické postupy?
Aglomeratívne a divízne
Aké poznáme hierarhické metódy a ich opis?
Metóda najbližšieho suseda - spája tie objekty, medzi ktorými je minimálna vzdialenosť medzi ich najbližšími prvkami.
Metóda najvzdialanejšieho suseda - Spája tie objekty, medzi ktorými je maximálna vzdialenosť medzi ich najvzdialenejšími prvkami.
Metóda priemernej vzdialenosti - Spája tie objekty, medzi ktorými je minimálna priemerná vzdialenosť.
Wardova metóda - Spojí tie zhluky, medzi ktorými dochádza k najnižšiemu nárastu variability.
Mediánová metóda - Je založená na vzdialenosti ťažísk. Do zhluku sa spoja tie metódy, medzi ktorými je minimálna vzdialenosť ich ťažísk (mediánu).
Centroidná metóda - Vychádza zo štvorca euklidovskej matice, do jedného zhluku sa spoja tie objekty, medzi ktorými je minimálna vzdialenosť ich ťažísk
Nehierarchické metódy
Metóda typických bodov - Zadávateľ sám na základe svojích skúseností určí, ktoré objekty majú byť typyckými predstaviteľmi novovytvorených zhlukov.
Metóda k-means -
Hlavné prístupy na stanovenie počtu zhlukov
Heuristický prístup - Zvolenie počtu na základe vlastného uváženia
Index grapovania - Vyberieme ten počet, pred ktorým dochádza k najväčšej strate informácii
Charakterizuj DA
Skúmanie závislosti jednej kvalitatívnej premennej od niekoľkých kvantitatívnych. Umožňuje triediť nové jednotky do vopred definovaných skupín.
Úlohy DA
Opisná - čo najlepšie zatriediť jednotky do skupín, pomocou diskriminačnej funckie
Klasifikačná - Čo najlepšie zatriediť novú jednotku do vopred definovaných skupín.
Predpoklady použia DA
Normálne rozdelenie údajov, presne definované skupiny štatistických jednotiek, významnosť zvolených diskriminačných premenných
Čo je heteroskedasticita a všetko čo o nej vieš
Predpoklad o konštantnom rozptyle
Čo je autokorelácia a všetko čo o nej vieš
Predpoklad o nekorelovanosti náhodných porúch
Čo je multikolinearita a všetko čo o nej vieš
Korelovanosť premenných modelu
Metódy zisťovania skrytých vzťahov?
FA, PCA
Marginálne rozdelenie pravdepodobnosti?
Pre náhodné premenné x1 a x2 nám hovoria o pravdepodobnosti, s akými budú premenné x1 a x2 nadobúdať rôzne hodnoty pokiaľ nevyužijeme informáciu o ich vzťahu
Čo je kovariačná matica
Matica, ktorá má na i-tom riadku a j-tom stĺpci kovarianciu medzi i-tým a j-tým prvkom
Na čo je Dixon test
Test extrémnych hodnôt, H0 v súbore nie sú extrémne hodnoty, H1 v súbore sú extrémne hodnoty
Podobnosť PCA a FA
Vytváranie nových premenných, zníženie dimenzie dát s čo najnižšou stratou informácie, odstránenie multikolinearity
Určenie počtu HK
Podľa vlastného uváženia, na základe eigenvalue (>1) alebo na základe scree plotu
Spoločný vs špecifický faktor
Spoločný vysvetluje najmenej 2 PP, špecifický len jednu
Iteračné metódy FA
Metóda maximálnej vierohodnosti, metódy nevážených najmenších štvorcov, iteračná metódy hlavných faktorov, alfa-faktorová analýzy
Na čo slúži rotácia faktorov?
Snaha nájsť lepšie interpretovateľnú maticu váh faktorov
Rozdiel medzi ZA a DA
ZA neparametrická, DA parametrická. ZA rozdeľuje objekty do skupín, ktoré vytvára. Pri DA sú skupiny dopredu už vytvorené
Aglomeratívny vs divízny prístup pri ZA
Aglomeratívny - Najprv je každá jednotka braná ako zhluk, na konci je každá jednotka vo veľkom spoločnom zhluku
Divízny - Najprv je každá jednotka vo veľkom zhluku, následne na konci je každá jednotka samostatne v zhluku
Všeobecný zápis HK
Y1=ai1x1+xi2x2+aipXp
Určenie počtu významných zhlukov
Heuristický prístup, Index grapovania (ukazovatele kvality)