Clase 3 - Extracción de características Flashcards
Importante a la hora de elegir las características.
- Datos originales no caracterizan el objetivo a predecir.
- Datos no están en la misma escala de medidas.
- Puede haber datos ruidosos.
- Datos como las fechas no aportan información adecuada, hay que tratar los datos.
- Encontrar patrones en el pasado que puedan volver a repetirse en el futuro.
Parámetros a elegir:
- Frecuencia de las observaciones
- Horizonte de predicción (muy importante a la hora de identificar tendencias).
- Ventanas de observaciones
- Desplazamiento para ejemplos de entrenamiento
Ventana
Para definir los datos históricos que se van a usar
Horizonte
La predicción que va a ocurrir (franja temporal en el futuro).
Características
- Rentabilidades pasadas (tener en cuenta que perdemos datos)
- ## Variaciones respecto a índices bursátiles
Indicadores de tendencia
Movimientos prolongados del precio en alguna dirección.
- Media móvil simple (tiene cierto delay). La media móvil reduce el ruido.
- Media móvil exponencial (con el parámetro alfa se ponderan los datos, alfa grande indica que tienen más peso los valores más recientes).
Indicadores de momentum
Aceleración de los cambios del precio.
- Oscilador estocástico (sitúa el precio respecto a el máximo y el mínimo de un intervalo de tiempo).
Ind. de volatilidad
Frecuencia e intensidad en la variación del precio a corto plazo.
- Media del Rango Verdadero (ATR): mide el rango real respecto al precio de cierre anterior.
- Bandas de Bollinger (desviación estándar)
Ind. de volumen
Cantidad de transacciones de un activo y su relación respecto al precio en un intervalo de tiempo.
Máximos y mínimos locales.
Puntos donde la mayoría del mercado estima un cambio en la valoración de los activos.
Señales técnicas
- Cambios de tendencia: medias móviles con ventanas temporales distintas. Los cruces de las medias nos indican si la tendencia es alcista o bajista.
- Beta del CAPM (medida de volatilidad de un activo relativa al riesgo sistémico del mercado).
Selección de datos
- Aleatoriamente
- Aquellos que se parecen más entre sí.
- De acuerdo a alguna distribución.
Selección de atributos (reducción de la dimensionalidad)
- Filtrado de atributos (mirando la correlación con el atributo a predecir)
- selección de su
Selección de atributos: wrappers
Para generar todos los posibles subconjuntos de atributos para hacer las predicciones.
- Ayuda a encontrar el mejor subconjunto (mejores predicciones)
Selección de atributos: principal component analysis
- Funciona con atributos numéricos.
- Consiste en una proyección del espacio de atributos original a uno reducido.
- Busca que los atributos sean independientes entre sí (poca correlación entre ellos, pero mucha correlación con la clase a predecir.)