Unsupervisied Learning Flashcards
Explica Unsupervised Learning
Corresponde a una rama del machine learning en el cual los datos no se encuentran etiquetados; lo que quiere decir que no existe una variable respuesta definida. El objetivo de este es descubir patrones dentro de los datos o estructuras sin intervensión o guia explicita. En pocas palabras imaginemos que tenemos datos de un pez, largo-ancho-alto sin saber sus especies y solo con estos datos podriamos probablemente identificar grupos(especies) presentes en nuestros datos.
Nombra los algoritmos comunes en Unsupervised Learning
- Clustering
—-kmeans
—-DBSCAN
2.Reducción Dimensionalidad
—–PCA
—–TSNE
Explica KMeans
KMeans es un algoritmo de clustering dentro del aprendizaje no supervisado, que intenta particionar un conjunto de datos en ‘k’ clusters distintos. Inicia seleccionando aleatoriamente ‘k’ centroides, y luego asigna cada punto de datos al centroide más cercano, formando clusters. Posteriormente, recalcula los centroides como el centro geométrico de todos los puntos asignados a ese cluster. Este proceso se repite hasta que los centroides se estabilizan y el algoritmo converge. Un desafío importante de KMeans es elegir el número correcto de clusters ‘k’, y es sensible a la forma y escala de los datos distribuido
Define Inertia
Corresponde a la suma total de las distancias al cuadrado entre cada punto un cluster con su centroide. Menor inertia significa una mejor agrupación de cada grupo. Busca medir que tan cohesionado estan los clusters.