Prov 3 AI Modelleringssteg Flashcards
Insamling av data
Samla in relevant data för modellen.
Förbereda data
Bearbeta data för träning.
Flattening
Omvandla flerdimensionell data till 1D.
- Avvikande värden
- Saknade värden
- Hantera extrema värden.
- Fyll i eller ta bort saknade värden.
Uppdelning av datamängd
- Träning
- Validering
- Test
Vad de gör
- För att träna modellen.
- För att justera hyperparametrar.
- För att utvärdera modellen.
Definiera modell
Välja rätt algoritm för uppgiften.
Hyperparametrar
Träna modellen
Justerbara inställningar som batch size, epoch och learning rate.
Utvärdera modellen
- Noggrannhet (accuracy)
- Känslighet (recall)
- Precision
Mät prestanda med kvalitetsmått:
- Andel rätt förutsägelser.
- Andel rätt identifierade positiva fall.
- Andel av positiva förutsägelser som är rätt.
Confusion matrix
En tabell som visar korrekta och felaktiga klassificeringar för varje klass.
Förbereda data
Modelleringsteg
Encoding: Omvandla kategoriska data till numeriska.
One-Hot Encoding: Skapa binära kolumner för varje kategori i en variabel.
Välja variabler/features: Identifiera de mest relevanta variablerna.
Skala data:
Normalisera: Skala värden till intervallet [0, 1].
Standardisera: Justera värden till en normalfördelning med medelvärde 0 och standardavvikelse 1.
Uppdelning av datamängd:
Träning: Data för att lära modellen.
Validering: Data för att justera hyperparametrar.
Test: Data för att utvärdera modellens prestanda
Batch size
Träna modellen
Antalet dataexempel som används i varje träningsiteration.
Epoch
Träna modellen
Ett varv genom hela träningsdatan.
Learning rate
Träna modellen
Hur stora steg algoritmen tar vid uppdatering av parametrar.