Einführung ins Maschinelle lernen Flashcards
Beschreibe Maschinelles lernen in einem Satz.
Beim maschinellen Lernen geht es darum, Erkenntnisse aus Daten zu gewinnen, um verschiedene Inferenzaufgaben zu lösen
Welche Art von Aufgaben kann maschinelles Lernen lösen?
- Prediction: trajectories, stock exchange price
- Anomaly detection: blockage, medicine
- Classification: pedestrians, iOS Siri, etc
- Ranking: feature selection, Google, Amazon ‘Customers Who Bought This Item Also
Bought’ - Decision making: AI, robotics, autonomous drivin
Gebe eine Definition von Maschinellem lernen
A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P , if its performance at tasks in T , as measured by P , improves with experience E
Wie sieht der Prozess der “pattern recognition” beim machinellen Lernen aus?
Pattern Reconition hat eine Pipline Struktur.
1. Data Collection: durch den Sensor
2. Präprozessierung bzw. Segmentierung: Löschen von insignifikanten Daten.
3. Feature extraction: Signifikante Segmente genauer untersuchen. Ein mögliches resultat ist ein Feature Vector
4. Klassifikator: Dort wird die entscheidung getroffen
5. Postprocessing: Anhand der Entscheidung das Problem lösen bspw. Anzeigen von erkannten Gesichtern. Schnittstelle zur eigentlichen Anwendung.
Wie sieht der Design Cycle beim maschinellen lernen aus?
Welche Arten des Lernens gibt es?
- Supervised Learning
- Unsupervised Learning
- Anomaly Detection
- Online (Sequentiel) Learning
- Query (Active) Learning
- Reinforcement Learning
- Semi-supervised Learning
Wie funktioniert supervised learning?
Trainingsdaten werden mit labeln versehen. Also Input mit gewünschtem output. Es wird die Beziehung zwischen input und output gelernt
Wie funktioniert unsupervised learning?
Trainingsdaten haben kein label. Es wird versucht eine plausible kompakte Beschreibung von Daten zu lernen.
Wie funktioniert Anomaly Detection?
Trainingsdaten mit oder ohne label. Es wird unterschieden zwischen erwarteten und unerwarteten Daten.
Wie funktioniert Online Learning?
Die Daten kommen sequentiell an. Sobald neue Daten ankommen wird das modell angepasst.
Wie funktioniert query learning?
Ein Agent kann ein update des Models anfragen. Dies passiert an stellen, an welcher das Model noch unsicher ist.
Wie funktioniert reinforcement learning?
Ein Agent kann mit der umwelt interagieren, aktionen durchführen und bekommt rewards für seine aktionen.
Wie funktioniert semi-supervised Learning?
Es wird mit einer geringen Menge an gelabelten Daten gelernt und ungelabelte Daten werden genutzt um die performance zu verbessern.
Definiere supervised learning
Erklären Sie den Unterschied zwischen Regression und Classification
Regression wird verwendet, um quantitative Variablen, beispielsweise kontinuierliche Werte, vorherzusagen.
Die Classification wird verwendet, wenn die Ausgabe nur über eine bestimmte Anzahl von Kategorien oder eine quantitative diskrete Variable verfügen kann.
Definiere unsupervised learning
Beschreibe wie unsupervised learning genutzt werden kann um cluster von Daten zu erstellen.
Unsupervised Learning wird genutzt, um Daten ohne Labels in Cluster zu gruppieren, basierend auf Ähnlichkeiten. Diese Cluster werden durch Eigenschaften wie Gewicht, Kovarianz und Mittelwert beschrieben. Ein Beispiel mit Wetterdaten verdeutlicht die Anwendung, indem verschiedene Klimazonen anhand von Temperatur und Wetterlagen identifiziert werden.
Woraus kann der Agent beim reinforcement learning bestehen?
- Policy ist die Strategie oder Regel, die angibt, welche Aktion in einem bestimmten Zustand ausgeführt werden soll.
- Value Function bewertet die Qualität eines Zustands oder einer Aktion und gibt an, wie gut es ist, sich in diesem Zustand zu befinden oder eine bestimmte Aktion auszuführen.
- State Transition Model prognostiziert, wie sich der Zustand des Systems ändern wird, wenn eine bestimmte Aktion in einem bestimmten Zustand ausgeführt wird. Es gibt an, welche neuen Zustände nach Ausführung einer Aktion erreicht werden können.
Erklären Sie das Konzept des Reinforcement Learning und seine Komponenten. Geben Sie ein Beispiel für seine Anwendung
Reinforcement Learning (RL) beinhaltet einen Agenten, der in einer Umgebung agiert und durch seine Aktionen Belohnungen erhält. Ziel ist es, diese Belohnungen zu maximieren. Der Agent kann sich dabei auf eine Policy verlassen, die Zustände auf Aktionen abbildet, oder auf eine Value Function, die den erwarteten Reward für das Befolgen einer Policy vorhersagt. Ein State Transition Model prognostiziert zudem zukünftige Zustände und Belohnungen. Ein Beispiel für RL sind optimierte Bewegungsmodelle für Aktorencluster wie Menschen in bekannten Umgebungen.