2.3 Mustererkennung und maschinelles Lernen (ML) Flashcards
Maschinelles Lernen - allgemein
- so alt wie die Künstliche Intelligenz selbst
- seit Kurzem das vorherrschende Paradigma in der KI-Forschung
Maschinelles Lernen - Definition nach Mitchell
- Computerprogramm lernt aus Erfahrung E
- in Bezug auf eine Klasse von Aufgaben T
- und einem Leistungsmaß P
- wenn sich seine Leistung bei Aufgaben T
- gemessen durch P
- mit der Erfahrung E verbessert
Maschinelles Lernen - Hauptmerkmal
- Definition nach Mitchell
-> Lernen aus Daten - stützt sich auf Vielzahl von Methoden, von klassischer Statistik bis hin zu algorithmisch motivierten Ansätzen
Maschinelles Lernen - Arten
- Überwachtes Lernen (Supervised Learning)
- Unüberwachtes Lernen (Unsupervised Learning)
- Bestärkendes Lernen (Reinforcement Learning)
Überwachtes Lernen - Daten
- arbeitet mit gelabelten bzw. markierten Datensätzen
- Trainingsdaten bestehen aus Objektbeschreibungen in Form von Merkmalen sowie dazugehörigen Kennzeichnungen (Labels)
Überwachtes Lernen - Aufgaben
können anhand der gegebenen Beispiele beschrieben werden
-> Ermittlung von Zuordnungen zwischen Merkmalswerten und Ausgaben
-» ermöglichen es, Kennzeichnung für bisher ungesehene Objekte vorherzusagen
Überwachtes Lernen - Arten
- Regression
- Klassifizierung
- Je nach Art des zu erzeugenden Ergebnisses
Überwachtes Lernen - Regression
- Ausgabe: kontinuierliche numerische Variable
- Ziel: Funktionen mit reellen Werten zu finden, die Abbildung zwischen Eingaberaum der Merkmale und Ausgaberaum der zugehörigen Werte darstellen
Überwachtes Lernen - Klassifizierung
- Ausgabe: auf begrenzte Menge von Werten beschränkt
- Beispiele: Kennzeichnung von E-Mails als Spam, Auffinden von Bildern mit bestimmten Inhalten in großen Bilddatenbanken
Unüberwachtes Lernen - Daten
arbeitet mit Daten ohne jegliche Kennzeichnung
Unüberwachtes Lernen - Hauptziel
Strukturen oder Muster in den Daten erkennen
Unüberwachtes Lernen - Beispiele
- Clustering: Auffinden von Gruppen von Datenpunkten mit hoher Ähnlichkeit
- Techniken zur Dimensionalitätsreduzierung: Konstruktion niedrigdimensionaler Projektionen von potenziell hochdimensionalen Merkmalsräumen, die gleichzeitig eine relevante Struktur beibehalten
- statistische Techniken: Wahrscheinlichkeitsdichtefunktionen von Zufallsvariablen schätzen
Bestärkendes Lernen - Hauptaskpekt
lernender Agent wird in einer Umgebung betrachtet
Bestärkendes Lernen - Agent
kann Aktionen durchführen, die seinen internen Zustand und den der Umgebung beeinflussen
Bestärkendes Lernen - Belohnungsfunktion
wird eingesetzt, um den Nutzen der durchgeführten Aktionen im Hinblick auf ein bestimmtes Ziel zu beurteilen
Bestärkendes Lernen - Lerndaten
Agent erzeugt seine eigenen Lerndaten durch Ausprobieren von Handlungsalternativen
-> keine vorherige Datenerfassung erforderlich
Bestärkendes Lernen - Zusammenhang Spiel- und Entscheidungstheorie
Rahmenbedingungen des Lernproblems
Bestärkendes Lernen - Beispiel
- AlphaZero
- lernten die Brettspiele Go, Schach und Shogi mit übermenschlichen Fähigkeiten zu spielen
- kannte anfangs nur die Grundregeln
- spielte ausgiebig gegen sich selbst
Maschinelles Lernen - Merkmale
- dynamisches Vorgang
- Mit Hilfe von Algorithmen realisiert
- Daten (meist sehr groß)
- Mustererkennung
Maschinelles Lernen - Merkmale - dynamischer Vorgang
- System kann sich an neue Daten anpassen
- lernt aus Erfahrungen
- ohne dem System explizit zu sagen, was in einer Aufgabenstellung getan werden muss
Maschinelles Lernen - Merkmale - Mustererkennung
- Bspw. Suche nach Linien, Clustern oder anderen Mustern in den Daten
- Versuch Realität durch mathematische Funktionen abzubilden
- Computer muss Funktion anhand der Daten selbst herausfinden
Maschinelles Lernen - Merkmale - Lösen der Aufgabe
Mathematische Modell wird genutzt um Aufgabenstellung zu lösen
Maschinelles Lernen - Kombination
Kombination aus:
* Mathematik
* Mustererkennung
* Datenspeicherung
Maschinelles Lernen - Herausforderung
datengestütze Technologie:
* Menge Trainigsdaten
* Qualität der Daten
* Generalisierbarkeit
* Messung der Performance
* Robustheit
* Erklärbarkeit
Maschinelles Lernen - Herausforderung - Menge an Trainigsdaten
- je mehr desto besser
- muss für den Anwendungsbereich tatsächlich vorhanden sein
Maschinelles Lernen - Herausforderung - Qualität der Daten
- Motto: garbage in -> garbage out
- falsch gelabelte Daten -> falsche Ergebnisse
-> Prüfung der Daten durch statistische Methoden und Visualisierung - Daten müssen repräsentativ sein (Abbilden der gesamten Datenmenge)
Maschinelles Lernen - Herausforderung - Generalisierbarkeit
- Aus Basis der Trainingsdaten
- Overfit: an Beispieldaten überangepasst (Trainingsdaten -> gute Ergebnisse, echte Daten -> schlechte Ergebnisse)
- Underfit: zu wenig angepasst (berücksichtigt die relevanten Unterschiede nicht ausreichend)
Maschinelles Lernen - Herausforderung - Messung der Performance
Je nach Lernstil und nach zu bearbeitender Fragestellung geeignete Metriken auswählen
Maschinelles Lernen - Herausforderung - Robustheit
wenig robust: kleine Änderungen der Einagbe -> deutliche Änderungen der Anwort
Maschinelles Lernen - Herausforderung - Erklärbarkeit
Erklärung möglich, wie ein Algorithmus zu einer bestimmten Entscheidung gekommen ist