11 Instanzbasiertes Lernen Flashcards
Instanzen-basiertes Lernen als lazy learning
Lernen = (einfaches) Abspeichern der Trainingsbeispiele
Weniger rechenzeit während des Trainings, dafür mehr bei anfragen zur klassifikation
unterschiedliche Hypothesen / lokale approximation der Zielfunktion für jede Anfrage
“fleißige” lernalgorithmen mit dem gleichen Hypothesenraum sind eingeschränkter
Instanzenbasiertes Lernen allgemein
Bildet für jede neue Anfrage eine andere Annäherung an die Zielfunktion
- lokale Approximation der Targetfunktion
- komplexere symbolische repräsentationen für Instanzen
Generalisierungsentscheidung wird bis zu einer konkreten Suchanfrage aufgeschoben
Neue Instanzen werden analog zu ähnlichen Instanzen klassifiziert
Intanzenbasiertes Lernen : Beurteilung
+ komplexe Targetfunktionen können modelliert werden
+ Information aus den Trainingsbeispielen geht nicht verloren
- evtl komplexe Berechnungen bei Klassifizierung neuer Instanzen
- Schwierigkeit: Welche Instanzen sind sich ähnlich?
- => Problem irrrelevanter Eigenschaften
Beispiele für Instanzenbasiertes Lernen
- k-Nearest Neighbor
- Lokal gewichtete REgression
- Radial Basis Function
- Fallbasiertes Schliessen (CBR)
Bewertung kNN
Induktiver Bias:
Klassifikation einer Instanz x_q ähnlich zu Klassifikationen anderer, benachbarter Instanzen
+ Robust in Bezug auf verrauschte Trainingsdaten Insbesondere mit Gewichtung
– Distanzmaß basiert auf allen Attributen Evtl. nur eine kleine Untermenge relevant „Curse of dimensionality“
– Speicherorganisation
– Haupt-Zeitaufwand in Klassifikation statt Training
Einordnung kNN
Typ der Inferenz: induktiv
Ebenen des Lernens: subsymbolisch
Lernvorgang: überwacht
Beispielgebung: nicht inkrementell
Umfang der Beispiele: umfangreich
Hintergrundwissen: empirisch
Case-based reasoning
allgemeines abstraktes Framework - kein direkt anwendbarer Algorithmus
Wiederverwendung alter Fälle
Suche nach Lösungen ähnlicher Probleme
Definition “Fall” bei CBR
Ein Fall ist die Beschreibung einer bereits real aufgetretenen Problemsituation zusammen mit den Erfahrungen, die während der Bearbeitung des Problems gewonnen werden konnten
enthält mind.:
- Problembeschreibung
- Lösung(-sversuch)
- Ergebnis
zusätzlich:
- Erklärung, warum das Ergebnis auftrat
- Lösungsmethode
- Pointer auf andere Fälle
- Güteinformation
CBS-Zyklus (4R)
Retrieve
Reuse
Revise
Retain
CBR Retain - Auswahl der Indizes
Manuell:
* der Benutzer gibt entsprechende Indizes vor
Check-Liste:
* Heuristiken zur Erstellung der Indizes
Differenzbasiert:
* Lösche solche Attribute, die in fast allen Instanzen vorkommen
Kombination beider Methoden:
- Erst Aufstellung der Checkliste
- Dann Löschen der überflüssigen Attribute durch Differenzverfahren
CBR Reuse
Lösungsadaption:
Arten der Lösungsübertragung
- keine Adaption, einfaches übertragen (copy9
- durch Benutzer
- (semi-)automatisiert - transformational / derivational reuse
Eingesetzte Methoden
- Benutzerinteraktion
- Regelbasiertes Schließen
- Modellbasiertes Schließen
- Planer
CBR Revise
Überpfürung, Verbesserung der Lösung
Evaluierung der Lösung
- Überprüfung durch Simulation
- Überprüfung in realer Welt
Verbessern bzw. Reparieren der Lösung
- Fehler erkennen und erklären
- Beseitigen unter Berücksichtigung der Fehlererklärung
Potentiell Iterativ
CBR Retain
Bewahrung der gemachten Erfahrung
Was wird gelernt?
- Neue Erfahrung
- Alten FAll generalisieren
- neue Merkmale (Indizes)
- Organisation der Fallbasis (Effizienz)
Methoden
- Auswendiglernen
- Induktive / Deduktive Lernverfahren
Bewertung CBR
+ konzeptuell einfach, aber trotzdem können komplexe Entscheidungsgrenzen gebildet werden
+ kann mit relativ wenig Information arbeiten
+ Analogie zu menschlichem Problemlösen
+ Lernen ist einfach (“one-shot learning”)
+ Günstig für mit Regeln schlecht erfassbare Probleme
- Gedächtniskosten
- Klassifikation kann lange dauern
- Hängt stark von Repräsentation ab
- Problematisch bei komplexen Repräsentationen
- Problematisch: irrelevante Eigenschaften
Einordnung CBR
Typ der Inferenz: Induktiv
Ebene des Lernens: symbolisch
Lernvorgang: überwacht
Beispielgebung: inkrementell
Umfang der Beispiele: gering
Hintergrundwissen: empirisch