VL 7&8 Flashcards

1
Q

Funktionsweise Unüberwachtes Lernen

A

• Exploratives Verfahren
• Deskriptives maschinelles Lernverfahren
• Ziel: Identifikation von möglichst homogenen Muster-Gruppen im Datensatz -> Cluster
• Gruppierung von Datenpunkten mit ähnlichen Eigenschaften, bspw.:
> Ähnliches Kundenprofil (Alter, Erfahrung, Fähigkeiten)
> Ähnliche Verhaltensweisen (Transaktionen, Intervalle)
• Anwendbar auf verschiedenen Datentypen (Intervall, ordinal, kategorisch) -> ggf. Datentransformation notwendig
• Kein Vorwissen über die Daten notwendig
• Ableitung von Mustern / Zusammengehörigkeiten ohne festgelegte Regeln auf Basis des zugrundeliegenden Datensatzes
• Keine feste Zielvariable gegeben (wie bei Klassifikation: Label) an dem sich das ML-Verfahren orientiert
• Kein vorhersagegetriebenes Lernverfahren Durchführung auf dem gesamten, bereinigten Datensatz
-> Keine Trainings- & Testphase im klassischen Sinne notwendig bei unüberwachten Lernverfahren (!)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Kundensegmentierung

A

• Bestimmung von Kundensegmenten durch gespeicherten Stammdaten & Verhaltensdaten
• individuelle Aktionsangebote für spezifische Kundencluster erstellen

• Nutzen
- Möglichkeit der gezielten Kundenansprache-> wie Kundenbindung & Zufriedenheit erhöhen
- Möglichkeiten des personalisierten Marketings
- Steigerung des Umsatzes durch systematisches, gezieltes Handeln

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Betrugserkennung (Fraud Detection)

A

• Erkennung von außerordentlichen/ungewöhnlichen Transaktionen
• Durchführung von Ausreißeranalysen mittels Clustering
• Beispiele für Potentielle Indikatoren für Betrugserkennung in Daten
- Dimension der Geldsumme
- Fehlende/mangelhafte Bonitätsinformationen
- Details über IP-Adresse
- Verwendung von mehr als einer Kreditkarte
- Eingabe korrekter Kartenprüfnummer (CVV)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

k-Means Clustering
Funktionsweise

A
  1. Bestimmung der Cluster-Anzahl k
  2. Initialisierung: Zufällige Auswahl von k Zentren zu Beginn
  3. Zuweisung aller Datenpunkte zum nächstliegenden Zentrum (Basis: Distanzmetrik)
  4. Verschieben der Cluster-Zentren in den Mittelpunkt aller zugeteilten Datenpunkte
  5. Durchführung der Schritte 2 & 3 bis sich Cluster-Zentren entweder nicht mehr verschieben ODER ein definiertes Abbruchkriterium erreicht ist (Anzahl Durchläufe/Iterationen)
    Distanzmetrik
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Distanzmetrik

A

• Abstand zwischen dem Datenpunkt & Cluster-Zentrum
• Beispiele für Distanz-Metriken anhand denen Clustering durchgeführt werden kann:
> Euklidischer Abstand
> Manhattan-Distanz
• Zielvorgabe: Distanzminimierung
• Gruppierung der Datenpunkte mit ähnlichen Eigenschaften bzw. Koordinaten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

k-Means - Vor- und Nachteile

A

Vorteile:
• einfache Anwendung auf den Daten
• Gute Skalierung auf großen Datenmengen
• Steuerung des Clustering möglich

Nachteile
• Clustergröße k muss selbst festgelegt werden
> Auf Basis von Informationen aus dem Anwendungskontext
 > Datengetriebene, mathematische Ableitung
• Ausschließliche Verarbeitung von numerischen Eingaben

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hierarchisches Clustering

A

• Häufig verwendete renommierte Technik (nach dem k-Means Clustering)
• Ziel: Generierung einer hierarchischen Cluster-Struktur
• Ableitung eines Dendrogramms (= Baum)
o Hierarchische Baumstruktur
o Baumstruktur mit Verästelungen
• Keine vorhergehende Definition der Cluster-Anzahl (k) erforderlich Möglichkeiten des hierarchischen Clusterings
1. Agglomeratives Clustering = Anhäufendes Clustering
2. Divisives Clustering = Aufteilendes Clustering

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hierarchisches (agglomeratives) Clustering – Funktionsweise

A
  1. Initialisierung: Beginne mit der Annahme, dass jeder Datenpunkt ein eigenes Cluster darstellt
  2. Linkage (= Zusammenführung): Zusammenführung der Cluster mit dem geringstem geometrischen Abstand zueinander
  3. Durchführung des 2. Schrittes (bis Abbruchkriterium erreicht wird)
    → In jedem Schritt werden 2 Cluster mit geringstem geometrischen Abstand zusammengeführt
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Möglichkeit des Linkage

A

• Minimaler Abstand zweier Punkte zwischen den Gruppen
• Mittlerer Abstand (Durchschnitt) aller Punkte beider Gruppe
• Abstand zwischen den Gruppenzentren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hierarchisches Clustering – Dendrogramm

A

• Werkzeug zur Evaluation von Clustering-Ergebnissen
• Achsen des Dendrogramms
o x-Achse: Auflistung Datenpunkte
o y- Achse: das ausgewählte Distanzkriteriums
• Hierarchische Zuordnung einzelner Cluster erkennbar
o Erkennung von Hauptgruppen
→ Distanz zur nächstliegenden Gruppe verhältnismäßig gering
o Erkennung von Ausreißern
→ Distanz zur nächstliegenden Gruppe verhältnismäßig hoch

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hierarchisches Clustering – Vor- und Nachteile

A

Vorteile:
• Verfolgbarkeit der genauen Zusammensetzung ausgehend von der Einzeldatenebene
• Offene Interpretationsmöglichkeit
• Festlegung der Cluster in Anlehnung an das hierarchische Clustering möglich

Nachteile
• Gefahr der Unübersichtlichkeit bei großen Datensätzen
• Ausschließliche Verarbeitung von numerischen Eingaben
• Bestimmung der Cluster-Anzahl nicht eindeutig

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Bewertung von Clustering

A

• Bewertung anhand Wahrheitsmatrizen nicht möglich, da Klassenlabels unbekannt
• Möglichkeiten der Beurteilung von Clustering

  1. Manuelle Beurteilung durch Expert:innen
  2. Silhouette Diagramm beim k-Means Clustering
  3. Dendrogramm beim hierarchischen Clustering
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Unterschied Clustering und Klassifikation?

A

Klassifikation
• Ziel: Zuweisung von bekannten Kategorien/Labels für unbekannte Daten
• Lernt auf Basis von Training & Testing
• Vorhersage der Labels für neue Daten

Clustering
• Ziel: Segmentierung/Aufteilung von Datensätzen in n Kategorien/Cluster
• Finden von Kategorien/Labels in den Daten → Labels unbekannt
• Beschreibender Charakter der Methode wie Muster in den Daten aussehen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Integration von Kl in Fahrzeugen

A

• Unterstützung des Menschen bei der Steuerung (Fahrassistenz) und komplette Übernahme von Teilaufgaben (Automatisierung)
• Stand heute: Zahlreiche straßenzugelassene Verkehrsmittel wie Autos oder Motorräder mit zahlreichen KI-
Assistenzsystemen
• Treffen intelligenter Entscheidungen & Ableitung intelligenter Handlungen von Kl durch Verarbeitung von Sensordaten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Fahrassistenzsystem

A

• Unterstützung des Fahrers & Erhöhung der Fahrsicherheit
• Eingriff des Assistenten in bestimmten, notwendigen Situationen
• Warnung durch ein Signal in Situationen: Bremsassistenten, Ausweichassistent, Abbiegeassistenz, Spurhalteassistenz, Kommunikationsassistenz

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Die 5 Stufen der Automatisierung

A

• Stufe 0 (= keine Automatisierung) -> Keine automatisierten Fahrfunktionen; Ggf. Warnsysteme vorhanden
• Stufe 1 (= Assistenz) -> Fahrassistenz durch zeitweise Übernahme der Lenkung; Parkassistenz
• Stufe 2 (= Teilautomatisierung) -> Übergabe der Lenkung in bestimmten Anwendungsfällen; Fortlaufende Überwachung des Fahrverhaltens & des Verkehrs; Eingriff durch den Fahrer bei Dringlichkeit erwünscht/notwendig
• Stufe 3 (= Hochautomatisiert) -> Keine dauerhafte Überwachung durch den Fahrer notwendig; Übernahme des Fahrens bei Aufforderung durch das System (bspw. abweichende Umgebungsbedingungen)
• Stufe 4 (= Vollautomatisiert) -> Möglichkeit der vollständigen Abgabe der Fahraufgabe an das System; Fahrer muss nicht mehr eingreifen, kann aber
• Stufe 5 (= Fahrerlos) -> Vollumfängliches Fahren durch das System auf allen Straßentypen; Kein Eingriff durch den Fahrer

17
Q

Def. Sensor

A

• Komponente, die eine gemessene physikalische Größe oder chemischen Effekt in ein analoges elektrisches Signal umwandelt
• Physikalische Größen: Druck, Gewicht, Beschleunigung, Lichtstärke, Temperatur, Feuchtigkeit, Strahlung, Schall, magnetischer Fluss, etc.

18
Q

Sensoren in intelligenten Autos

A

• Ziel: Robuste & akkurate Wahrnehmung der Umwelt
• Beobachtung der Umgebung durch Kameras, Radar, Lichterkennung etc.
• Erkennung von: Fahrspur, Ampeln, Verkehrszeichen & Schilder, Objekte (Tiere & Fußgänger)

19
Q

Funktionen von ausgewählten Sensoren

A

• GPS
 > Ortung des Fahrzeugs durch GPS
 > Information über Koordinaten (Breiten-/ Längengrad & Hohe)
 > Transformation in eine eindeutige Position des Fahrzeugs
• Radar, Ultraschall & Lidar (Light Detection and Ranging)
 > Erkennung von festen & sich bewegenden Hindernissen
 > Ermöglichung der relativen Positionierung eines Fahrzeugs
• Kameras
 > Detaillierte Wahrnehmung der Umgebung eines Fahrzeugs

20
Q

Herausforderungen der Datenbasis :

A

• Kosten für das Sammeln ausreichender Sensordaten sehr hoch
• Zustände, welche im Verkehrsleben auftreten können z.B. StVO, Staus & Unfälle, Schlechtes Wetter (Regen, Glätte)
• Kritische & seltene Fahrszenarien müssen in den Daten abgedeckt werden!
> Vermeidung von Kollisionen

21
Q

Vor und Nachteile des Autonomes Verkehrs

A
22
Q

DARPA Grand Challange 2005

Das Autonome Fahrzeug von Waymo

A

• Wettbewerb für selbstfahrende Autos
• 212 km durch wüstenähnliches Gelände in Nevada
• Streckeninformationen aus GPS-Koordinatendaten für Streckenpunkte im Abstand von 72 m
• 5/23 selbstfahrenden Autos erreichen das Ziel
• Verwendung zahlreicher Sensoren: Videokamera, Laser-Entfernungsmesser, Radar, GPS, Lagesensoren

• Führende Rolle im autonomen Fahren
• Einsatz im Straßenverkehr
• Einsatz von KI zur Verbesserung der Sensoren
• Mehr als 16 Millionen autonom zurückgelegte Kilometer (!)
• Waymo erhält als erste Firma von der kalifornischen Behörde die Erlaubnis, vollständig fahrerlose Autos (ohne menschliche Sicherheitsfahrer) zu betreiben