Unsupervisied Learning Flashcards

1
Q

Explica Unsupervised Learning

A

Corresponde a una rama del machine learning en el cual los datos no se encuentran etiquetados; lo que quiere decir que no existe una variable respuesta definida. El objetivo de este es descubir patrones dentro de los datos o estructuras sin intervensión o guia explicita. En pocas palabras imaginemos que tenemos datos de un pez, largo-ancho-alto sin saber sus especies y solo con estos datos podriamos probablemente identificar grupos(especies) presentes en nuestros datos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Nombra los algoritmos comunes en Unsupervised Learning

A
  1. Clustering
    —-kmeans
    —-DBSCAN

2.Reducción Dimensionalidad
—–PCA
—–TSNE

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Explica KMeans

A

KMeans es un algoritmo de clustering dentro del aprendizaje no supervisado, que intenta particionar un conjunto de datos en ‘k’ clusters distintos. Inicia seleccionando aleatoriamente ‘k’ centroides, y luego asigna cada punto de datos al centroide más cercano, formando clusters. Posteriormente, recalcula los centroides como el centro geométrico de todos los puntos asignados a ese cluster. Este proceso se repite hasta que los centroides se estabilizan y el algoritmo converge. Un desafío importante de KMeans es elegir el número correcto de clusters ‘k’, y es sensible a la forma y escala de los datos distribuido

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Define Inertia

A

Corresponde a la suma total de las distancias al cuadrado entre cada punto un cluster con su centroide. Menor inertia significa una mejor agrupación de cada grupo. Busca medir que tan cohesionado estan los clusters.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly