Tema 2: Analítica descriptiva Flashcards
Analítica descriptiva
Es una etapa preliminar de procesamiento de datos que crea un resumen de los datos históricos para proporcionar información útil y, de esta manera, preparar los datos para su posterior análisis
Business Reporting
Un Business Reporting es un documento escrito que contiene información relacionada con un negocio con el objetivo de convertir los datos en información útil sobre la que se puede actuar. Algunas de las características más importantes de los BR son: claridad, brevedad, completitud y veracidad.
Dashboard (Cuadro de mando)
Representación visual de información consolidada en una única vista para que pueda ser interpretada rápidamente. Incluye información de contexto para facilitar interpretación.
Data warehouse (DW)
Repositorio de datos organizados expresamente para ser usados como soporte a la toma de decisiones. Es un repositorio de datos actuales e históricos de interés potencial para gestores a lo largo de la organización.
Gestión del rendimiento empresarial (BPM)
Conjunto integrado de procesos empresariales, metodologías, métricas y aplicaciones diseñadas para gestionar y mejorar el rendimiento global de una empresa, tanto en el plano financiero como en el operacional.
Histograma
Se utiliza para mostrar la frecuencia de distribución de una o más variables. En el eje x se representan las categorías o rangos y en el eje y las medidas, valores o frecuencias. Evidencian la distribución de la los datos respecto a una característica.
Key Performance Indicator (KPI)
Medida del rendimiento de una organización en una actividad determinada que permite cuantificar el desempeño de la organización y compararlo con un objetivo prefijado.
Mapa de Calor (Heatmap)
Tipo de visualización de datos en el que se representan valores contínuos usando un gradiente de colores.
OLTP
Es un tipo de procesamiento que facilita y administra aplicaciones transaccionales, usualmente para entrada de datos y recuperación y procesamiento de transacciones
Online Analytical Processing (OLAP)
Enfoque que permite responder de forma rápida preguntas concretas sobre el negocio ejecutando consultas (queries) contra repositorios de datos organizacionales (data warehouses, data marts). Es la técnica de análisis de datos más usada en datawarehousing
Visual Analytics
Combinación de técnicas de visualización, analítica predictiva y creatividad humana que permiten comprender y encontrar solucionas a problemas complejos, facilitando de esta manera la toma de decisiones.
Big Data.
Se refiere al conjuntos de datos o combinaciones de conjuntos de datos cuyo volumen, complejidad y velocidad de crecimiento dificultan su captura, gestión, procesamiento o análisis mediante tecnologías y herramientas convencionales. Son datos estructurados y no estructurados, almacenados en un sistema de ficheros distribuido y con un procesamiento paralelo masivo (los trabajos se dividen y ejecutan en paralelo).
Cubo OLAP
Es una estructura de datos multidimensional que permite el análisis rápido de los datos. Un analista puede navegar a través de los datos buscando una información en concreto y sus cambios en el tiempo.
Diagrama de dispersión.
Es un gráfico de dos o tres dimensiones en el que cada variable se representa en una dimensión. Los valores de las variables se representan mediante punto en el gráfico. Los de dos dimensiones son muy útiles para estudiar la correlación entre dos variables-
Proceso ETL
Extraer, transformar y cargar (ETL, Extract, Transform, Load) es el proceso de compilación de datos a partir de un número ilimitado de fuentes, su posterior organización y centralización en un único repositorio.
Six Sigma
Metodología BPM de mejora de procesos, centrada en la reducción de la variabilidad de los mismos, reforzando y optimizando cada parte de proceso consiguiendo reducir o eliminar los defectos o fallos en la entrega de un producto o servicio al cliente. La meta de seis sigma es llegar a un máximo de 3,4 defectos por millón de eventos u oportunidades (DPMO), entendiéndose como defecto cualquier evento en el que un producto o servicio no logra cumplir los requisitos del cliente.
Características data warehouse.
- No volátil: datos obsoletos se descartan, los cambios se guardan como nuevos datos.
- Resumida: no contiene toda la información, solo la relevante.
- Metadatos
Tipos de data warehouse
- Data marts: pequeños, enfocados a temas concretos.
- Operational data store (ODS): almacén temporal a corto plazo
- Enterprise data warehouse (EDW): dw a gran escala que se usa en toda la empresa.
Proceso ETL
Extract, Transform, Load
Balance Scorecard (Cuadro de mando integral)
- Medición del rendimiento
acoplado con la dirección estratégica de la organización
– Perspectiva financiera (Financial)
– Perspectiva comercial o del cliente (Customer)
– Perspectiva de los procesos internos (Internal business
processes)
– Perspectiva de las personas y del crecimiento (learning and
growth)
Sistema BPM
– Aplicaciones BPM
– Hub de información
– Sistemas fuente (fuente de datos)