Föreläsning 6(clustering) Flashcards

1
Q

Vad är clustering?

A

Dela in objekt/data i grupper baserat på likheter

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Med vad för typ av maskininlärning gör man clustering?

A

Unsupervised learning(no labels)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Vad är syftet med clustering?

A

Understand: gain insight into data, generate hypotheses and identify salient features
Structure: Identify taxonomies and relationships among data points
Compress: Organize data and summarize it through representatives(“prototypes”)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vad är stegen i k-means clustering?

A
  1. randomize the centers(you have decided on the number of centers before)
  2. form the clusters
  3. Move the centers so that they are closer to the points in their cluster(we do this by computing the mean
    x-coordinate and the mean y-coordinate)
    4 . form the clusters
    ->continue to move the centers and form clusters until the clusters stay the same when you try to move them
    closer to their data points.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Ge exempel på vad k-means clustering används till

A

Marketing(suggesting products) and customer personas(identifying representatives of each cluster)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Vad står DBSCAN för och när uppfanns det?

A

Density-Based Spatial Clustering of Applications with Noise, 1996

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Vad är hyperparametrarna i DBSCAN?

A

*a distance measure(metric)
*epsilon: a number defining the max distance between neighbors
*minpts: a number defining the min number of points in a cluster

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Vilka tre typer av data points finns i DBSCAN och vad utmärker dem?

A

Core point: har minst(at least) minpts grannar
Border point: en icke-core point som har minst en core point som granne
Noise point: outlier. Ej core eller border(dvs har inga core points som grannar)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Vad är stegen i DBSCAN clustering?

A
  1. välj ut en random core point(p) och gör den t.ex blå.
  2. gör alla grannar till p blå
  3. om någon av p:s grannar också är core points, gör även deras grannar blå etc
  4. när det inte finns fler att fylla i blå, välj en annan random core point att fylla i t.ex grön. repetera
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hur gör man hierarchical clustering?

A

Hitta de två närmsta points som inte är i samma cluster och gör dom till samma cluster. Fortsätt tills du har
det önskade antalet clusters(är angett i hyperparametrarna)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Vad är ett dendrogram?

A

Ett “träd” som visar hela den hierarchichal clustering process(utan att stoppa vid ett angett antal clusters)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Vilken process användes tidigare för kartlägga släkt-avståndet mellan olika arter genom deras
ribosome DNA sequences och vilken process används i moderna approacher?

A

Omodern: hierarchical clustering
modern: hidden markov models

How well did you know this?
1
Not at all
2
3
4
5
Perfectly