Kapitel 7 - Clustering & probabilistic Topic-Models Flashcards
1
Q
Welche 3 Komponenten muss jeder Algorithmus für Machine Learning enthalten?
A
- Repräsentation: Was bedeuten meine Feature-Vektoren? Bzw. wie können die Feature-Vektoren (quantitativ) miteinander verglichen werden? (Abstandsfunktionen)
- Evaluation: Wie kann einem Ergebnis eine quantitative Güte zugeordnet werden? (Fehlerfunktionen)
- Optimierung: Wie kann ein Modell erstellt werden, dass einen möglichst kleinen Fehler macht?
2
Q
In welche Kategorien lässt sich Machine Learning grundlegend einteilen?
A
- Klassifikation / Regression
- wird einem Datenpunkt eine diskrete Klasse oder numerischer Wert zugeordnet? - Supervised / Unsupervised Learning
- gibt es für jeden Datenpunkt einen Zielwert, oder erhält das Modell nur die Trainingsdaten?