BASE DE DATOS - UDLC - Lic Ciencia de Datos Flashcards

1
Q

¿Qué es el almacenamiento primario?

A

Es el medio donde la CPU puede operar directamente, incluye memoria principal y caché. Proporciona acceso rápido pero capacidad limitada.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

¿Cuál es la principal diferencia entre almacenamiento secundario y terciario?

A

El secundario incluye discos duros fijos, mientras el terciario se refiere a medios removibles como cintas y discos ópticos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

¿Por qué se usan las cintas magnéticas en bases de datos?

A

Se utilizan principalmente para backups por su bajo costo, aunque el acceso es más lento y requiere proceso offline.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

¿Qué caracteriza a la memoria caché?

A

Es la memoria más rápida y cara, utilizada por la CPU para acelerar la ejecución de programas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

¿Qué es la Primera Forma Normal (1FN)?

A

Elimina grupos repetitivos y asegura que cada celda contenga un valor atómico.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

¿Qué caracteriza a la Segunda Forma Normal (2FN)?

A

Elimina dependencias parciales y requiere que los atributos no clave dependan completamente de la clave primaria.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

¿Qué es la Tercera Forma Normal (3FN)?

A

Elimina dependencias transitivas entre atributos no clave.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

¿Qué es un índice en bases de datos?

A

Es una estructura que mapea valores de columnas a filas para mejorar la eficiencia en búsquedas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

¿Qué es un índice principal?

A

Es el índice creado sobre la clave primaria de una tabla, garantizando unicidad.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

¿Qué es un índice secundario?

A

Es un índice creado en columnas que no son parte de la clave primaria.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

¿Qué es un índice denso?

A

Tiene una entrada por cada valor de la clave de búsqueda en el archivo de datos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

¿Qué es un índice no denso?

A

Solo tiene entradas para algunos valores de búsqueda, no para todos los registros.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

¿Qué es una Slow Change Dimension?

A

Es una estrategia para manejar cambios graduales en las dimensiones de un Data Warehouse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

¿Qué es SCD Tipo 1?

A

Sobrescribe los valores antiguos sin mantener histórico.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

¿Qué es SCD Tipo 2?

A

Añade una nueva fila para mantener el histórico de cambios con fechas de inicio y fin.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

¿Qué significa ACID en transacciones?

A

Atomicidad, Consistencia, Aislamiento y Durabilidad.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

¿Qué es la atomicidad en transacciones?

A

La transacción se ejecuta completamente o no se ejecuta en absoluto.

18
Q

¿Qué es el aislamiento en transacciones?

A

Las transacciones deben ejecutarse como si estuvieran aisladas de otras transacciones simultáneas.

19
Q

¿Qué es la durabilidad en transacciones?

A

Los cambios confirmados deben persistir en la base de datos incluso tras fallos.

20
Q

¿Qué es una tabla de hechos?

A

Contiene las métricas o medidas del negocio y es típicamente incremental.

21
Q

¿Qué es una dimensión?

A

Proporciona el contexto descriptivo para los hechos y cambia más lentamente.

22
Q

¿Cuáles son los principales problemas del enfoque de archivos tradicional?

A

Redundancia, errores de ingreso, falta de estandarización y problemas de seguridad.

23
Q

¿Qué es la redundancia en bases de datos?

A

Duplicación innecesaria de datos que puede llevar a inconsistencias.

24
Q

¿Qué es la estandarización en bases de datos?

A

Establecer formatos consistentes para el ingreso de datos (fechas, números, etc.).

25
Q

¿Cómo se consulta el estado actual en SCD Tipo 2?

A

WHERE Fecha_Fin = ‘2100-12-31’ o fecha máxima establecida.

26
Q

¿Cómo se consulta un estado histórico en SCD Tipo 2?

A

WHERE [fecha_consulta] BETWEEN Fecha_Inicio AND Fecha_Fin

27
Q

¿Qué es una transacción de solo lectura?

A

Una transacción que únicamente recupera datos sin realizar actualizaciones.

28
Q

¿Qué es la memoria DRAM?

A

RAM dinámica que provee área de trabajo principal para la CPU, más barata pero más lenta que la RAM estática.

29
Q

¿Qué es la memoria flash?

A

Memoria de alta densidad y rendimiento que usa tecnología EEPROM.

30
Q

¿Qué significa que los datos estén ‘offline’?

A

Requieren intervención manual o automática para ser accesibles, como en cintas magnéticas.

31
Q

¿Qué es un índice agrupado?

A

Un índice donde los datos físicos se ordenan según el índice.

32
Q

¿Cuál es la principal ventaja de un índice agrupado?

A

Mejora el rendimiento en consultas que requieren datos ordenados.

33
Q

¿Cuál es la principal desventaja de los índices secundarios?

A

Requieren espacio adicional de almacenamiento.

34
Q

¿Qué es la integridad referencial?

A

Garantiza que las relaciones entre tablas sean válidas y consistentes.

35
Q

¿Qué es un constraint en bases de datos?

A

Una regla que restringe los valores permitidos en una columna o tabla.

36
Q

¿Por qué no se deben crear demasiados índices?

A

Pueden impactar negativamente el rendimiento en operaciones de escritura.

37
Q

¿Qué es la fragmentación de índices?

A

Desorganización física de las páginas del índice que puede afectar el rendimiento.

38
Q

¿Qué es el área de staging?

A

Zona temporal para datos crudos antes de su transformación final.

39
Q

¿Qué es un proceso ETL?

A

Extract, Transform, Load - proceso para mover datos de fuentes a un destino final.

40
Q

¿Qué son los metadatos en un Data Warehouse?

A

Información sobre la estructura, significado y uso de los datos almacenados.