10. predavanje: Uvod u duboko učenje Flashcards
Navesti središnji problem u strojnom/dubokom učenju.
Središnji problem u strojnom/dubokom učenju je smislena transformacija podataka - učenje smislene reprezentacije.
Navesti funkcije gubitka koje se koriste kod problema klasifikacije i regresije.
- Binarna klasifikacija: unakrsna entropija
-(1/N) * sum_i ( y_ilog(y_i’) + (1-y_i)log(1-y_i’) ) - Regresija: srednja kvadratna pogreška, srednja
apsolutna pogreška
Objasniti motivaciju uvođenja aktivacijske funkcije i navesti primjere.
Bez nje imamo linearnu transformaciju ulaznih podataka. Za bogatiji prostor hipoteza treba nelinearnosti, odnosno aktivacijske funkcije. Primjeri: ReLu, Sigmoida.
Objasniti važnost sloja modela dubokog učenja.
Svaki sloj radi jednu jednostavnu geometrijsku transformaciju na podacima koji prolaze kroz njega.
Objasniti pojam optimizacije.
Optimizacija je proces prilagođenja modela u cilju postizanja najboljih performansi za podatke za učenje.
Objasniti pojam poopćenja.
Poopćenje je kvaliteta kako se trenirani model ponaša na podacima koje prije nije vidio. Ne možemo ju kontrolirati. Možemo jedino prilagoditi model podacima.
Navesti posljedicu induktivne pristranosti.
Induktivna pristranost dopušta algoritmu za učenje da prioritizira jedno rješenje pred rguima, neovisno o podacima.
Navesti glavne klase neuronskih mreža.
- MLP: potpuno povezane mreže
- CNN: konvolucijske mreže
- RNN: povratne mreže
Kada se koristi potpuno povezana mreža (MLP)?
- ulazni podatci sa sastoje od uzoraka fiksne
veličine - MLP izvodi podudaranje uzorka za fiksnu
ulaznu veličinu - odlično za po dijelovima linearne podatke
Kada se koristi konvolucijska mreža (CNN)?
- ulazni podatci imaju rešetkastu strukturu poput
2D/3D slika i videa - hvata svojstva slika: lokalna i globalna
invarijantnost na rešetci - odlično za rešetkasto strukturirane podatke
Kada se koristi povratna mreža (RNN)?
- ulazni podaci su uređeni slijedovi (mogu varirati veličinom) - rekurzivna formula sumira sekvencu s vektorom h - ne mogu naučiti dugotrajne zavisnosti
Na koji način stopa učenja utječe na postupak učenja modela?
Premala stopa: polagano učenje i mogućnost da zaglavimo u lokalnom minimumu. Prevelika stopa: prilikom osvježavanja možemo završiti u slučajnom dijelu krivulje (divergencija).
Navesti osnovne probleme kod postupka učenja modela.
- učenje nije počalo, gubitak učenja ne opada s
vremenom - učenje je počelo u redu, ali model ne
poopćava dovoljno - ne postižemo bolje od
podrazumijevane osnovne točnosti - gubitak učenja i validacije opada, postižu se
rezultati bolji od podrazumijevane osnovne
točnosti, no ne može se pretrenirati
Navesti moguća rješenja osnovnih problema kod postupka učenja modela.
- podešavanje parametara gradijentnog spusta
- korištenje adekvatne arhitekture
- povećanje kapaciteta modela
Definirati proces ručne konstrukcije značajki.
Proces korištenja vlastitog znanja o podacima i korištenom algoritmu strojnog učenja u cilju postizanja da algoritam radi bolje primjenom rukom kodiranih transformacija podataka.