Clase 7 - Aprendizaje no supervisado Flashcards

1
Q

Diferencia con aprendizaje supervisado.

A

No conocemos los valores de la salida deseada: no hay atributo de salida.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Aprendizaje no supervisado:

A

Aprendizaje por agrupación y asociativo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Motivación:

A
  • Encontrar patrones en los datos.
  • Agrupar los individuos
  • Identificar instancias de prototipos.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Modelos no supervisados.

A
  • Tenemos conjunto de entrada, pero no conocemos el conjunto de salida.
  • Definición de criterios: similitud, grupos balanceados, etc.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Técnica de clustering

A

Agrupar conjuntos con elementos similares
- Generación de jerarquías.
Importante: decidir el número de grupos que vamos a generar.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Aplicaciones

A

Réplica estratificada de un índice bursátil.
Identificación de cambios en relaciones estructurales del mercado (evolución de ratios de cotización entre activos) -> identificación de outliers.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Algoritmo agrupación con k-medias

A

Asignación de un cluster a cada instancia y buscar un centroide o prototipo (representado por la media/punto medio) que represente al grupo.

  • Proceso iterativo:
  • asignar k centroides aleatoriamente a k instancias.
  • Asignar a cada instancia el cluster más cercano según medida de distancia.
  • Actualización: recalcular el centroide del cluster haciendo el punto medio de todos los atributos.
  • Útil para algoritmos de discretización de señales analógicas.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Agrupación con k-medoids

A

Similar a k-medias, pero los centroides son instancias reales.
Procedimiento PAM: Partitoning around medoids
- Busca minimizar la distancia media de todas las instancias del cluster.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Validación en clustering

A
  • Verificar si los clusters encontrados representan estructuras reales de los datos.
  • Comparar el resultado de diferentes algoritmos de clustering
  • Determinar el número de clusters a utilizar en k-medias
  • Minimización de la distorsión media de los ejemplos a su centroide.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Validación Silhoutte:

A

Medir la similitud de los miembros de su cluster comparado con la similitud a las instancias de otros clusters.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Selección del número de clusters.

A

Regla de oro: k = sqrt(n/2)

n==numero de ejemplos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Técnicas aglomerativas.

A

Se utilizan para generar jerarquía de grupos

  • Se crean árboles llamados dendogramas.
  • Se calcula la distancia entre todos los pares de ejemplos.
  • Se unen los dos más cercanos y se consideran como ejemplo único.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Algoritmo de conjuntos más frecuentes (aprendizaje asociativo)

A

Dados ejemplos no etiquetados, determinar subconjuntos que son más frecuentes.
Ej: análisis de carros de compra

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Algoritmo a priori

A

Encontrar en el conjunto de individuos todos los items que aparecen en al menos un S% de los carros.
- Encontrar todos los pares de items.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Reglas de asociación (aplicación práctica de los algoritmos)

A

Se puede usar como entrada el aprendizaje de conjuntos más frecuentes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly