Materia Quiz #1 Flashcards

1
Q

Componentes generales de un DW

A

Sistemas operacionales
Área de staging
Área de presentación de datos
Herramientas de acceso

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Formas de llamar un datamart

A

Versión especializada de un DW
Pequeño datawerehouse
Es sobre un área de negocios especializadas
Puede servir como herramienta analítica para las necesidades de un departamento

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Fases genéricas para la construcción de un DW

A

Identificar requerimientos
Reconocer fuentes de datos originales
Definir procesos de selección, transformación e importación de datos
Transformar e importar datos
Construir el esquema multidimensional

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Para tomar en cuenta para la calidad en los datos

A

Validez
Consistencia
Completitud
Oportunidad
Relevancia

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Diseño del DW modelado dimensional

A

Dimensión: Colección de atributos relacionados
Ej..nombre, precio, peso, marca
Hechos:Datos operativos almacenados, son medidas
Ej..cantidad de unidades, costo unitario, ganancias, promedio de unidades
Medidas: Valores de datos que se analizan, columna en la tabla de hechos
Ej.. cantidad de frutas, cantidad …

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Modelo multidimensional el esquema estrella hechos y dimensiones

A

Centro de la estrella: hechos en la tabla de hechos
Cada dimensión se muestra por separado en tablas de dimensión

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

OnLine Analytical Precessing (OLAP)

A

Categoría de software que profundiza en los datos mediante acceso interactivo, rápido, consistente, en una amplia variedad de posibles vistas de información

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Objetivos de los modelos multidimensionales

A

Representar los datos en forma cercana a la intuición del usuario
Resolver problemas planteados en sistemas relacionados

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Características de los cubos de datos

A

Se presentan los datos como una matriz
Ejes: criterios de análisis
Celdas: valores a analizar

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Estructura de los cubos

A

Dimensiones:
1.Criterios de análisis de los datos
2.Variables independientes
3.Ejes
Medidas:
1.Valores o indicadores a analizar
2.Variables en la intersección de las dimensiones

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Dimensiones

A

Pueden contener jerarquías
Los valores se organizan en jerarquías (categorías)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Medidas

A

Se ubican en la intersección de algunos valores de las dimensiones
Dado un valor para cada dimensión se puede determinar un valor para la medida

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Tipo de medidas

A

Aditivas: Se pueden sumar ya que el valor se mantiene fijo
Semi aditivas: Se pueden sumarizar por algunas dimensiones, pero no por otras
No aditivas: No tiene sentido totalizar por ninguna dimensión

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Opraciones que se pueden realizar en los cubos

A

Slice
Dice
Rotación
Drill-down
Drill-up
Roll-up

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Que contienen la tabla de hechos

A

Llaves de tablas de dimensión
Medidas totalmente aditivas
Medidas semi-aditivas (atributos derivados)
Gran cantidad de registros
Pocos atributos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Llaves en el esquema estrella

A

Llaves primarias, cada fila está identificada de manera única
Llaves subrogadas, implica mantener la llave original cómo atributo adicional en la dimensión
Llaves foráneas

17
Q

Los hechos (facts) en el modelado dimensional son

A

Datos almacenados que son medidas

18
Q

En un cubo de datos la siguiente operación permite navegar desde datos más resumidos hacia datos más detallados

A

Drill-down

19
Q

La siguiente operación permite seleccionar un subconjunto de datos de un cubo basado en una sola dimensión específica

A

Slice

20
Q

Las tablas de hechos contienen

A

Llaves de tabla de dimensión y medidas

21
Q

Que se lleva a cabo en el área de staging

A

La transformación de datos

22
Q

En el esquema estrella, en las tablas de dimensión que llaves se utilizan

A

Subrogadas

23
Q

Etapas para el diseño del data mart

A

Etapa 1: Diseño de las dimensiones
Etapa 2: Diseño de la tabla de hechos
Etapa 3: Definición de las medidas

24
Q

Que cambios existen en las tablas de hechos

A

Agregar filas
Muy pocas actualizaciones

25
Q

Que cambios existen en las tablas de. Dimensión

A

Corrección de errores (Tipo 1)
Preservación de historia (Tipo 2) SUCEDE EN LA FILA
Preservación solo 1 valor previo (Tipo 3) SUCEDE EN LA COLUMNA

26
Q

Cómo son los cambios tipo 1

A

Es una sobre escritura
Se da principalmente porque es necesario corregir un error
No es necesario mantener el valor anterior ni en el sistema fuente ni en el DW

27
Q

Cómo son los cambios tipo 2

A

Originalmente son cambios en los sistemas transaccionales
Cada cambio en el atributo debe conservarse, se conserva en el DW
Los datos se dividen en grupos (antes y después del cambio)

28
Q

Cómo son los cambios de tipo 3

A

Se agrega un atributo en la dimensión para almacenar el valor anterior
Se pasa el valor actual al atributo creado
No es necesario agregar una nueva fila en la tabla de dimensión

29
Q

Características de dimensiones grandes

A

Tienden a presentar múltiples jerarquías
Algunas funciones del DW podría volverse lentas e insuficientes
Requiere técnicas adicionales para optimización

30
Q

Que se considera una dimensión grande

A

Cuando es profunda (alto número de filas) es ancha

31
Q

Que es ETL

A

Extract
Transform
Load

32
Q

Dificultades de los ETL

A

Diversidad de sistemas transaccionales
Múltiples plataformas
Sistemas legados, tecnologías BD obsoletas

33
Q

Fase de extracción de los datos para un ETL

A

Identificar las fuentes de los datos
Método de extracción~Para cada fuente indicar si será automatizado o manual
Frecuencia de extracción
Ventana de tiempo~Para cada fuente de datos
Manejo de excepciones~Registro que no se puede extraer

34
Q

Identificación de fuentes

A

Para cada métrica y cada atributo identificar
Sistema y base de datos, tabla y atributos fuentes

35
Q

Extracción inmediata

A

Es en tiempo real
Se puede realizar mediante~Captura a través de bitácoras de transacciones y triggers

36
Q

Extracción diferida

A

Puede darse mediante
Captura basada en fechas y estampado de tiempo~Se estampa cada registro nuevo o actualizado
Captura por comparación de archivos~Snapshot diferencial

37
Q

Fase de transformación, principales tareas

A

Selección
Dividir_Unir
Conservación
Resumir
Derivar nuevos datos

38
Q

Cuáles son algunos problemas de la integración de datos

A

Identificación de entidades
Reconciliación de duplicados
Múltiples fuentes

39
Q

Fases de a carga de datos

A

Los principales métodos son
Carga completa
Carga incrementar~Streaming, por lotes Batch