Vorlesung 9 Flashcards

1
Q

Was ist unüberwachtes Lernen?

A

Wenn man einen ungelabelten Datensatz hat und eine Struktur in den Daten finden muss

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was ist Clustering?

A
  • Clustering ist eine häufige Aufgabe im unüberwachten Lernen.
  • Ziel ist es, Datenpunkte in Gruppen oder Cluster zu unterteilen.
  • Ähnliche Datenpunkte gehören demselben Cluster an.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Beschreib den k-Means Algorithmus

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wie funktioniert der Lloyd’s Algorithmus?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was besagt das Theorem (NP-Härte des k-Means)?

A

Das Auffinden der global optimalen Lösung des k-Means-Optimierungsproblems ist NP-schwer (sowohl wenn k fest oder variabel ist, als auch wenn die Dimension fest oder variabel ist).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was besagt das Theorem (Geglättete Komplexität des k-Means)?

A

Die Optimierung des k-Means-Zielwertes hat eine polynomiale geglättete Komplexität (smoothed complexity).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Nenn Varianten von k-Means

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wieso maximiert man bei PCA die Varianz?

A

Die PCA sucht also nach den sogenannten Hauptkomponenten, die die größtmögliche Varianz der ursprünglichen Variablen erklären können. Indem die Varianz maximiert wird, wird sichergestellt, dass so viel wie möglich von der ursprünglichen Information erhalten bleibt, während die Dimensionalität des Datensatzes reduziert wird.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wie zentriert man Datenpunkte?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was tut man bei PCA?

A

Varianz maximieren und unterdimensionieren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wie nennt man die Eigenvektoren bei PCA?

A

Die Eigenvektoren werden als Hauptachsen, Hauptrichtungen oder Hauptkomponenten bezeichnet (principal components)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wie nennt man den Abstand zwischen einem Punkt und seiner Projektion?

A

Rekonstruktionsfehler oder Projektionsfehler

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wann funktioniert PCA am besten?

A

PCA funktioniert am besten, wenn die Daten aus einer Normalverteilung stammen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wie wird PCA zur Dimensionsreduktion angwandt?

A

PCA kann die Anzahl der Merkmale/Features reduzieren, während die meisten Informationen erhalten bleiben

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wie wird PCA zur Datenvisualisierung angwandt?

A

PCA kann hochdimensionale Daten in einen niedrigdimensionalen Raum transformieren, um sie zu visualisieren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wie wird PCA zur Rauschfilterung angewandt?

A

Durch Entfernen der Komponenten mit geringen Eigenwerten kann PCA Daten Rauschen minimieren

17
Q

Wie wird PCA zur Merkmalsextraktion angewandt?

A

PCA kann die wichtigsten Merkmale aus einem Datensatz extrahieren, um maschinelles Lernen zu verbessern

18
Q

Ist PCA empfindlich gegenüber Ausreißern?

A

Ja