1. Vorlesung Flashcards
Supervised machine learning (goal)
Finden einer deterministischen Abbildung von einem Satz von Inputs X auf einen Satz der Zielvariablen Y
ML überwacht
(xi [Eingang], yi [Ausgang])
ML unüberwacht
(xi)
Der Generalisierungsfehler
(theoretisches Risiko) ist der erwartete Verlust R[f]
Empirische Risiko Minimierung
-das empirische Risiko auf D zu minimieren
Nachteile:
- Konvergenz Rˆ[f ] → R[f ] langsam, erfordert großes N
- Im Allgemeinen kein eindeutiges Minimum (möglicherweise schlechte Verallgemeinerung, keine differenzierte Lösung)
Satz von Base
P(y|x)=P(x|y) P(y) / P(x)
Das Perceptron
- ist ein binärer Klassifikator
- realisiert eine Hyperebene im Eingangsraum mit normalem Vektor w und Abstand b/_∥w∥ vom Ursprung
Die Aktivierungsfunktion
ist eine Funktion für neuronale Netze, welche σ lautet, und einem linearen Operator folgt
Operator
Ein Operator ist eine mathematische Vorschrift, durch die man aus mathematischen Objekten neue Objekte bilden kann. Er kann eine standardisierte Funktion oder eine Vorschrift über Funktionen sein.
Parameter
Als Parameter, auch Formvariable, wird in der Mathematik eine Variable bezeichnet, die gemeinsam mit anderen Variablen auftritt, aber von anderer Qualität ist. Man spricht auch davon, dass ein Parameter beliebig, aber fest ist.
Orthogonal zueinander
sind Ebenen oder Geraden, wenn sie einen Winkel von 90 Grad einschließen.
∃
existieren
∀
Alle
Konvergenzergebnis unter zwei Annahmen
- die xn liegen in einer Kreisfläche mit dem Radius R
- die beiden Bestände können mit einem Spielraum γ>0 getrennt werden
Konvergenz prüfen
4 R^2 / gamma ^2 bedeutet, dass keine falsch klassifizierte Probe nach verbleiben kann.
Weil:
1. Die Grenze ändert sich nicht, wenn die Population skaliert wird, und
2. je größer der Rand, desto schneller klassifiziert der Algorithmus alle Proben korrekt.
(kleines R und großes Gamma = schnelle Konvergenz)