Grunder för maskininlärning Flashcards
Data delas upp i tre dataset:
- Träningsdata
- Valideringsdata
- Testdata
Träningsdata
Den data som modellen tränar på
- Hitta mönster och generalisera
Valideringsdata
Används under träningens gång, ofta efter epoch. För att se om generaliseringen är bra eller lutar mot overfitting
Testdata
Den data som används när träningen är klar
- Data som modellen aldrig tidigare sett
- Testar generaliseringsförmåga
Generaliserbarhet
Modellens förmåga att prestera bra på ny osedd data
- För at undvika overfitting
Overfitting
När modellen lär sig brus och detaljer
- Anpassad efter specifika träningsdatan
- Inte lärt sig mönstret
- Kan inte prestera på osedd data
- Kan inte generalisera
Optimering
Process där modellens parametrar justerar för att minska loss function
Vad är målet med träningen?
Få modellen att hitta underliggande mönster och kunna generalisera
Optimerare
Algoritmer som används för att justera vikterna under träningens gång
- Gradient Descent
- Stochastic Gradient Descent
- ADAM
Gradient Descent
Beräknar derivatan över hela träningsdatan
Stochastic Gradient Descent
Beräknar derivatan, men justerar vikt efter varje enskild data, inte för hela datasetet
ADAM
Avancerad och dynamisk för varje parameter
Outliers
Avvikande värden på data
Datapunkterna är inte optimala och ger en missvisande träning, påverkar underliggande mönstret fel
- Vilket leder till overfitting
Noise
Brusig data
- Slumpmässiga variationer som inte är relaterade till det verkliga mönstret.
- Kan användas för att skapa data
Underfitting
När en modell är för enkel eller otränad
- Inte lyckats fånga det underliggande mönstret
The manifold hypothesis
Att man kan få högdimensionell data till lägre dimensioner utan att förlora viktig information
-Beskriver hur en bild som är högdimensionell och kanske har 1000 pixlar kan beskrivas med någora få parametrar som färg och ljusstyrka
Interpolering
Matematisk metod för att uppskatta värden inom ett intervall baserat på kända värden.
Ex skapa en funktion som ligger mellan en handskriven 6 och 0. För att sedan kunna sätta en gräns när de övergår
K-fold validation
Metod för att utvärdera modellen under pågående träning
Delar upp data för att testa prestation efter varje iteration
Batchstorlek
Hur många datapunkter som används för varje iteration
Iteration
Ett steg i träningen där en batch används
Epoch
När all data passerat genom modellen en gång
Learning rate
Bestämmer hur mycket modellen ska justera sina vikter för varje iteration
Vad är det som producerar en output i en perceptron?
Aktiveringsfunktionen
Hur gör man för att hantera med komplexa klassificeringsproblem med en perceptron?
Man sätter ihop flera perceptroner
- Multi layer perceptron