Clustering Flashcards

1
Q

Was ist das Ziel des Clustering in maschinellem Lernen?

A

Identifikation von Gruppen oder Clustern in Daten, bei denen Mitglieder innerhalb eines Clusters ähnlich sind .

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was ist der k-Means-Algorithmus?

A

Ein nicht-probabilistischer Clustering-Algorithmus, der Datenpunkte auf Basis ihrer Distanz zu Clustermittelpunkten zuordnet und iterativ die Position der Clusterzentren optimiert .

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wie funktioniert der E-Schritt im k-Means-Algorithmus?

A

Im E-Schritt werden Datenpunkte hart einem Cluster zugeordnet, basierend auf ihrer Distanz zu den Clustermittelpunkten .

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wie funktioniert der M-Schritt im k-Means-Algorithmus?

A

Im M-Schritt werden die Werte der Clustermittelpunkte basierend auf den zugeordneten Datenpunkten neu geschätzt .

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was ist ein Gaußsches Mischmodell (GMM)?

A

Ein probabilistischer Ansatz für Clustering, der verschiedene Wahrscheinlichkeitsdichten zulässt und die Parameter des Mischmodells mit dem Erwartungs-Maximierungs-Algorithmus schätzt .

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wie wird K im k-Means-Algorithmus bestimmt?

A

K, die Anzahl der Cluster, muss vorab gegeben sein; bei GMMs kann K durch Maximierung der marginalen Wahrscheinlichkeit, z.B. mit dem Bayesschen Informationskriterium (BIC), integriert gewählt werden .

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was ist der Erwartungs-Maximierungs(EM)-Algorithmus im Kontext von GMMs?

A

Ein iterativer Algorithmus zur Maximierung der Likelihood in Gaußschen Mischmodellen durch abwechselndes Auswerten der Verantwortlichkeiten (E-Schritt) und Neu-Schätzen der Parameter (M-Schritt) .

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wie werden Verantwortlichkeiten in GMMs berechnet?

A

Verantwortlichkeiten, auch als posterior Wahrscheinlichkeiten bekannt, werden als der Anteil berechnet, den eine Komponente zur Erklärung einer Beobachtung nimmt, und hängen von den aktuellen Parameterwerten ab .

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was ist die Rolle der Verantwortlichkeiten im GMM?

A

Verantwortlichkeiten wirken wie weiche Labels und bestimmen den Einfluss jeder Mischkomponente auf die Erklärung der Datenpunkte .

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wie wird die Log-Likelihood in GMMs optimiert?

A

Die Log-Likelihood wird durch die Anwendung des EM-Algorithmus maximiert, der iterativ auf die Konvergenz der Parameter abzielt .

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was sind die Herausforderungen bei der Anwendung von Clustering-Algorithmen?

A

Herausforderungen umfassen die Wahl der Anzahl der Cluster, den Umgang mit unterschiedlichen Dichtestrukturen und die Behandlung von Ausreißern .

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wie beeinflusst die Wahl der Distanzmetrik das Ergebnis des k-Means-Algorithmus?

A

Die Wahl der Distanzmetrik (z.B. Euklidische Distanz) beeinflusst die Form der Cluster und die Zuordnung der Datenpunkte .

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was ist die Bedeutung von Ausreißern in Clustering-Algorithmen?

A

Ausreißer können die Bestimmung der Clusterzentren verzerren und führen oft zu schlechteren Clustering-Ergebnissen .

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wie kann die Leistung von Clustering-Algorithmen bewertet werden?

A

Die Leistung kann durch interne Maße wie die Silhouetten-Breite oder externe Maße wie den Adjusted Rand Index bewertet werden .

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Welche Rolle spielen Mischkoeffizienten in GMMs?

A

Mischkoeffizienten bestimmen den Anteil jeder Komponente an der Gesamtmischung und beeinflussen die Gewichtung der Verantwortlichkeiten für die Datenpunkte .

How well did you know this?
1
Not at all
2
3
4
5
Perfectly