Clusters Flashcards

1
Q

Cual es el objetivo del modelo de cluster detection?

A

Clasificar un conjunto de datos en grupos compuestos por objetos similares (no estamos en busqueda de predecir un outcome, sino en econtrar ciertos patrones en los datos).
Si los grupos están previamente definidos hablamos de un algoritmo K-mean y si los grupos son un resultante del algoritmo hablamos de los jerarquicos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

En Cluster Detection, Que es el centroide y a qué ser refiere la cantidad de clusters?

A

Centroide: en cada iteración se identifica el centroide que es el objeto mas representativo del cluster, osea la mediana.

Cantidad de clusters: La cantidad de grupos resultantes se puede predefinir (K-means) o puede ser un resultante del algoritmo (jerárquico).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Cuales son los algoritmos de clusters?

A

Jererquico: Puede ser top-down o bottom-up. Al emprezar las iteraciones cada objeto es un cluster o todo el conjunto es un cluster.

K-means: Se predefine la cantidad de grupos/clusters. En la primera iteracion se seleccionan los centrides al azar y luego se van remplazando en cada iteracion.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Ventajas y desventajas de los modelos de clusters?

A

Ventajas
Buen desempeño con datos categóricos, numéricos o textuales.
Facil de utilizar.

Desventajas
Dificultad para elegir las medidas de distancias correctas.
Sensibilidad a los parámetros iniciales.
Dificultad para interpretar los clusters restantes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly