VŠA Flashcards

1
Q

Definuj viacrozmerné metódy

A

Metóda analýzy závislostí, metódy skrytých vzťahov, klasifikačné metódy

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Definuj metódy analýzy závislostí

A

RaKA a DA. Premenné možno rozdeliť na závislé/nezávislé. Cieľom je nájsť ako vplývajú nezávislé premenné na závisle premennú

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Definuj metódy skrytých vzťahov

A

PCA a FA. Premenné nemožno rozdeliť na závislé/nezávislé. Ak sa medzi premennými nachádza multikolinearita, teda sú premenné na seba navzájom korelované, tak ide také isté množstvo informácie vysvetliť aj menším počtom premenných. Ich hlavná úloha je vytvoriť premenné, ktoré nie sú korelované a ktoré vysvetľujú čo najvyšši rozptyl

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Definuj klasifikačné metódy

A

ZA a DA. Ich cieľom nie je sledovať premenné ale objekty, pričom podobné objekty zgrupiť do skupín na základe spoločných znakov čo najlepšie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Opíš PCA metódu

A

Metóda skrytých vzťahov. Ordinálna metóda, ktorá umožňuje redukovať počet dimenzií v Euklidovskom priestore tak, aby došlo k čo najmenšej strate informácie. Premenné nie sú rozdelené na závislé a nezávislé. Podmienkou jej použitia je výskyt silnej multikolinearity medzi premennými. Nové premenné, ktoré sú definované PCA sa nazývajú HK, ktoré sú nekorelované

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Typy PCA

A

Centrovaná - Vychádza z kovariačnej matice - začiatočný bod sa presúva z pôvodného bodu do centroidu objektu.
Štandardizovaná - vychádza z korelačnej matice - Začiatočný bod sa presúva z pôvodného bodu do centroidu objektu, pričom sú pôvodné hodnoty normované (ich rozptyl je 1)
Necentrovaná - Vychádzame z pôvodného bodu, začiatočný bod sa nachádza v tom istom bode, ako bol na začiatku

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Definuj komponentové skóre

A

Skóre jednotlivých objektov v novo definovanom priestore za pomoci nových premenných, HK

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Definuj vlastné vektory

A

Vyjadrujú smer vektorov, ktoré charakterizujú vplyv pôvodných znakov na komponenty. Čísla vlastných vektorov predstavujú váhy jednotlivých premenných pri tvorbe príslušného komponentu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Definuj vlastné čísla

A

Vyjadrujú smer variability, ktorá je zachytená príslušným komponentom

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Definuj FA

A

Metóda skrytých vzťahov určená na zjednodušenie štatistických analýz. Analyzuje sa štruktúra vzťahov medzi veľkou množinou premenných tak, aby bolo možné určiť spoločné faktory. FA vytvára novú premennú faktor, pričom pôvodné premenné sú lineárnou kombináciou daných faktorov

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Typy faktorov

A

Spoločný faktor - latentná premenná, ktorá vysvetľuje najmenej 2 pôvodné premenné
Špecifický faktor - latentná hypotetická premenná, ktorá vysvetľuje len jednu pôvodnú premennú

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Druhy FA

A

Prieskumná - nie je vopred určený žiaden možný vzťah o faktorovej štruktúre PP
Potvrdzujúca - Poznáme vopred určitú hypotézu o rozdelení faktorov, ktorú FA buď prijímeme alebo zamietneme

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Postup realizácie FA

A

Vyber premenných, zistenie kolinearity medzi premennými a posúdenie vhodnosti dát na vykonanie FA (KMO), samotná FA, možná rotácia faktorov pri ťažkej interpretácii. Interpretácia výsledkov a faktorového skóre

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Podobnosti FA a PCA

A

Metódy skrytých vzťahov, znižovania dimenzie. FA sa snaží vysvetliť kovariancie a korelácia pôvodných premenných pričom pri PCA je hlavným nositeľom informácie rozptyl

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Definuj klasifikačné metódy

A

Metódy, pomocou ktorých už nesledujeme premenné ale jednotlivé objekty, pričom ich hlavnou úlohou je roztriediť objekty do skupín (zhlukov) tak, aby vnútrozhluková variabilita bola čo najnižšia a medzizhluková variabilita čo najväčšia

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Definuj ZA

A

Cieľ je vytvoriť zhluky.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Aké sú miery podobnosti/nepodobnosti

A

Euklidovská metrika, Euklidovská štvorcová, Minkovského, Hammingova a Mahalanobisova

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Čím je zaujímavá Mahalanobisova metrika?

A

Nevyžaduje nekorelované údaje

19
Q

Aké poznáme zhlukovacie postupy?

A

Hierarchické a nehierarchické

20
Q

Rozdiel medzi hierarchickými a nehrierachickými postupmi?

A

Pri hierarhických dochádza k spájaniu/rozpájaniu zhlukov na každom kroku

21
Q

Aké poznáme hierarchické postupy?

A

Aglomeratívne a divízne

22
Q

Aké poznáme hierarhické metódy a ich opis?

A

Metóda najbližšieho suseda - spája tie objekty, medzi ktorými je minimálna vzdialenosť medzi ich najbližšími prvkami.
Metóda najvzdialanejšieho suseda - Spája tie objekty, medzi ktorými je maximálna vzdialenosť medzi ich najvzdialenejšími prvkami.
Metóda priemernej vzdialenosti - Spája tie objekty, medzi ktorými je minimálna priemerná vzdialenosť.
Wardova metóda - Spojí tie zhluky, medzi ktorými dochádza k najnižšiemu nárastu variability.
Mediánová metóda - Je založená na vzdialenosti ťažísk. Do zhluku sa spoja tie metódy, medzi ktorými je minimálna vzdialenosť ich ťažísk (mediánu).
Centroidná metóda - Vychádza zo štvorca euklidovskej matice, do jedného zhluku sa spoja tie objekty, medzi ktorými je minimálna vzdialenosť ich ťažísk

23
Q

Nehierarchické metódy

A

Metóda typických bodov - Zadávateľ sám na základe svojích skúseností určí, ktoré objekty majú byť typyckými predstaviteľmi novovytvorených zhlukov.
Metóda k-means -

24
Q

Hlavné prístupy na stanovenie počtu zhlukov

A

Heuristický prístup - Zvolenie počtu na základe vlastného uváženia
Index grapovania - Vyberieme ten počet, pred ktorým dochádza k najväčšej strate informácii

25
Q

Charakterizuj DA

A

Skúmanie závislosti jednej kvalitatívnej premennej od niekoľkých kvantitatívnych. Umožňuje triediť nové jednotky do vopred definovaných skupín.

26
Q

Úlohy DA

A

Opisná - čo najlepšie zatriediť jednotky do skupín, pomocou diskriminačnej funckie
Klasifikačná - Čo najlepšie zatriediť novú jednotku do vopred definovaných skupín.

27
Q

Predpoklady použia DA

A

Normálne rozdelenie údajov, presne definované skupiny štatistických jednotiek, významnosť zvolených diskriminačných premenných

28
Q

Čo je heteroskedasticita a všetko čo o nej vieš

A

Predpoklad o konštantnom rozptyle

29
Q

Čo je autokorelácia a všetko čo o nej vieš

A

Predpoklad o nekorelovanosti náhodných porúch

30
Q

Čo je multikolinearita a všetko čo o nej vieš

A

Korelovanosť premenných modelu

31
Q

Metódy zisťovania skrytých vzťahov?

A

FA, PCA

32
Q

Marginálne rozdelenie pravdepodobnosti?

A

Pre náhodné premenné x1 a x2 nám hovoria o pravdepodobnosti, s akými budú premenné x1 a x2 nadobúdať rôzne hodnoty pokiaľ nevyužijeme informáciu o ich vzťahu

33
Q

Čo je kovariačná matica

A

Matica, ktorá má na i-tom riadku a j-tom stĺpci kovarianciu medzi i-tým a j-tým prvkom

34
Q

Na čo je Dixon test

A

Test extrémnych hodnôt, H0 v súbore nie sú extrémne hodnoty, H1 v súbore sú extrémne hodnoty

35
Q

Podobnosť PCA a FA

A

Vytváranie nových premenných, zníženie dimenzie dát s čo najnižšou stratou informácie, odstránenie multikolinearity

36
Q

Určenie počtu HK

A

Podľa vlastného uváženia, na základe eigenvalue (>1) alebo na základe scree plotu

37
Q

Spoločný vs špecifický faktor

A

Spoločný vysvetluje najmenej 2 PP, špecifický len jednu

38
Q

Iteračné metódy FA

A

Metóda maximálnej vierohodnosti, metódy nevážených najmenších štvorcov, iteračná metódy hlavných faktorov, alfa-faktorová analýzy

39
Q

Na čo slúži rotácia faktorov?

A

Snaha nájsť lepšie interpretovateľnú maticu váh faktorov

40
Q

Rozdiel medzi ZA a DA

A

ZA neparametrická, DA parametrická. ZA rozdeľuje objekty do skupín, ktoré vytvára. Pri DA sú skupiny dopredu už vytvorené

41
Q

Aglomeratívny vs divízny prístup pri ZA

A

Aglomeratívny - Najprv je každá jednotka braná ako zhluk, na konci je každá jednotka vo veľkom spoločnom zhluku
Divízny - Najprv je každá jednotka vo veľkom zhluku, následne na konci je každá jednotka samostatne v zhluku

42
Q

Všeobecný zápis HK

A

Y1=ai1x1+xi2x2+aipXp

43
Q

Určenie počtu významných zhlukov

A

Heuristický prístup, Index grapovania (ukazovatele kvality)