3. predavanje: Vizualizacija podataka Flashcards
Navesti dvije glavne svrhe vizualizacije podataka.
Analiza podataka i komunikacija.
Koji je cilj vizualizacije podataka kod analize podataka?
Vizualizacija je vrlo bitna za razumijevanje skupa podataka, otkrivanje pogrešaka u podacima i postavljanje ostvarivih ciljeva analize.
Navesti vrste vizualizacije podataka.
Statička vizualizacija i interaktivna vizualizacija (omogućuje korisniku akcije za izmjenu elemenata).
Nabrojiti grafove s obzirom na broj varijabli.
- Jedna varijabla: histogram, kutijasti graf, pitni
graf, stupčasti graf - Dvije varijable: graf raspršenja, linijski graf.
- Više varijabli: matrica raspršenja, posloženi
graf, mjehuričasti graf, površinski 3D graf,
radarski graf.
Za kakav se tip varijabli koristi histogram?
Kategoričke i numeričke.
Za kakav se tip varijabli koristi kutijasti dijagram (engl. boxplot) i od kojih se dijelova sastoji?
Prikaz pojedinačne numeričke varijable. Minimum, donji kvartil, medijan, gornji kvartil i maximum.
Za kakav se tip varijabli koristi pitni dijagram (engl. pie chart)?
Prikaz pojedinačne kategoričke varijable.
Za kakav se tip varijabli koristi stupčasti dijagram (engl. bar chart)?
Prikaz pojedinačnih kategoričkih varijabli.
Navesti razliku između histograma i stupčastog dijagrama.
Glavni razlog za korištenje histograma je kada je potrebno razumjeti distribuciju niza numeričkih podataka. S druge strane, stupčasti dijagram dobro funkcionira za usporedbu između kategorija. S diskretnim podacima, razlika između histograma i stupčastog dijagrama manje je očita. Moguće je upotrijebiti bilo koji.
Za kakav tip varijabli se koristi dijagram raspršenja (engl. scatter plot)?
Prikaz odnosa dviju numeričkih varijabli.
Za kakav tip varijable se koristi linijski dijagram (engl. line chart)?
Prikaz jedne ili više numeričkih varijabli, najčešće u odnosu na varijablu vremena.
Za kakav tip varijable se koristi matrica dijagrama raspršenja (engl. scatter plot matrices)?
Prikaz odnosa između više uparenih numeričkih varijabli.
Za kakav tip varijable se koristi posloženi dijagram?
Prikazuje međuodnos tri ili više (numeričkih ili kategoričkih) varijabli.
Za kakav tip varijable se koristi mjeručasti dijagram (engl. bubble chart)?
Prikazuje međuodnos tri (2D) ili četiri (3D) numeričke varijabli.
Za kakav tip varijable se koristi površinski 3D dijagram?
Prikazuje međuodnos tri ili četiri numeričke varijable.
Za kakav tip varijable se koristi radarski dijagram (engl. spider chart)?
Prikazuje vrijednosti pet ili više varijabli određenog primjera (uzorka).
Nabrojiti neke postupke redukcije dimenzionalnosti s primjenom u vizualizaciji.
Analiza glavnih komponenti, samoorganizirajuća mapa, t-SNE.
Objasniti princip iza analiza glavnih komponenti.
Glavne komponente izražene su kao linearna kombinacija izvornih značajki i to takva da redom pokrivaju najveću varijabilnost u podacima. Korisno za otkrivanje grupa podataka.
Objasniti princip iza samoorganizirajuće mape.
Umjetna neuronska mreža učena nadzirano preslikava ulazne podatke u niskodimenzionalnu reprezentaciju. Težine se uče kompetitivnim učenjem.
Objasniti princip iza t-SNE tehnike.
Radi se o tehnici učenja višestrukosti - traži niskodimenzionalnu strukturu takvu da svojstva grupiranja u višoj dimenziji ostanu sačuvana.