Algoritmos de Agrupamiento Basados en Densidad Flashcards
ST-DBSCAN
• Uno de los problemas principales que tienen los algoritmos de agrupamiento es que no lidian exitosamente con datos que tienen una dependencia espacio-temporal.
• ¿Quésondatosespacio-temporales?
– Son “laminas” temporales de un espacio de datos.
– Por ejemplo, datos que dependen de la geografía o la hora, estación del año, día, etc.
• Los algoritmos no funcionan bien porque deben considerar las vecindades geográficas y temporales de los objetos de forma de extraer conocimiento útil.
• ST-DBSCAN mejora DB-SCAN en tres aspectos:
- Puede agrupar datos espacio-temporales de acuerdo
a sus atributos no-espaciales y espaciales. - Puede detectar puntos ruidosos cuando existen clústeres de diferente densidad, ya que asigna a cada clúster un factor de densidad.
- Soluciona el problema de que los valores de densidad de los objetos de un borde, pueden ser muy diferentes a los del borde opuesto. ST-DBSCAN compara el valor promedio de un clúster con el nuevo que ingresa.
DBSCAN drescipción
• DBSCAN utiliza sólo una métrica de distancia y un solo parámetro de distancia para medir similitud.
• ST-DBSCANproponedosmétricasdedistancia,y por ende, dos parámetros 1 y 2 para definir similitud mediante la unión de dos conjunto de densidades.
– 1 se utiliza para datos espaciales (e.g., cercanos geográficamente).
– 2 se utiliza para datos no-espaciales