BASE DE DATOS - UDLC - Lic Ciencia de Datos Flashcards
¿Qué es el almacenamiento primario?
Es el medio donde la CPU puede operar directamente, incluye memoria principal y caché. Proporciona acceso rápido pero capacidad limitada.
¿Cuál es la principal diferencia entre almacenamiento secundario y terciario?
El secundario incluye discos duros fijos, mientras el terciario se refiere a medios removibles como cintas y discos ópticos.
¿Por qué se usan las cintas magnéticas en bases de datos?
Se utilizan principalmente para backups por su bajo costo, aunque el acceso es más lento y requiere proceso offline.
¿Qué caracteriza a la memoria caché?
Es la memoria más rápida y cara, utilizada por la CPU para acelerar la ejecución de programas.
¿Qué es la Primera Forma Normal (1FN)?
Elimina grupos repetitivos y asegura que cada celda contenga un valor atómico.
¿Qué caracteriza a la Segunda Forma Normal (2FN)?
Elimina dependencias parciales y requiere que los atributos no clave dependan completamente de la clave primaria.
¿Qué es la Tercera Forma Normal (3FN)?
Elimina dependencias transitivas entre atributos no clave.
¿Qué es un índice en bases de datos?
Es una estructura que mapea valores de columnas a filas para mejorar la eficiencia en búsquedas.
¿Qué es un índice principal?
Es el índice creado sobre la clave primaria de una tabla, garantizando unicidad.
¿Qué es un índice secundario?
Es un índice creado en columnas que no son parte de la clave primaria.
¿Qué es un índice denso?
Tiene una entrada por cada valor de la clave de búsqueda en el archivo de datos.
¿Qué es un índice no denso?
Solo tiene entradas para algunos valores de búsqueda, no para todos los registros.
¿Qué es una Slow Change Dimension?
Es una estrategia para manejar cambios graduales en las dimensiones de un Data Warehouse.
¿Qué es SCD Tipo 1?
Sobrescribe los valores antiguos sin mantener histórico.
¿Qué es SCD Tipo 2?
Añade una nueva fila para mantener el histórico de cambios con fechas de inicio y fin.
¿Qué significa ACID en transacciones?
Atomicidad, Consistencia, Aislamiento y Durabilidad.
¿Qué es la atomicidad en transacciones?
La transacción se ejecuta completamente o no se ejecuta en absoluto.
¿Qué es el aislamiento en transacciones?
Las transacciones deben ejecutarse como si estuvieran aisladas de otras transacciones simultáneas.
¿Qué es la durabilidad en transacciones?
Los cambios confirmados deben persistir en la base de datos incluso tras fallos.
¿Qué es una tabla de hechos?
Contiene las métricas o medidas del negocio y es típicamente incremental.
¿Qué es una dimensión?
Proporciona el contexto descriptivo para los hechos y cambia más lentamente.
¿Cuáles son los principales problemas del enfoque de archivos tradicional?
Redundancia, errores de ingreso, falta de estandarización y problemas de seguridad.
¿Qué es la redundancia en bases de datos?
Duplicación innecesaria de datos que puede llevar a inconsistencias.
¿Qué es la estandarización en bases de datos?
Establecer formatos consistentes para el ingreso de datos (fechas, números, etc.).
¿Cómo se consulta el estado actual en SCD Tipo 2?
WHERE Fecha_Fin = ‘2100-12-31’ o fecha máxima establecida.
¿Cómo se consulta un estado histórico en SCD Tipo 2?
WHERE [fecha_consulta] BETWEEN Fecha_Inicio AND Fecha_Fin
¿Qué es una transacción de solo lectura?
Una transacción que únicamente recupera datos sin realizar actualizaciones.
¿Qué es la memoria DRAM?
RAM dinámica que provee área de trabajo principal para la CPU, más barata pero más lenta que la RAM estática.
¿Qué es la memoria flash?
Memoria de alta densidad y rendimiento que usa tecnología EEPROM.
¿Qué significa que los datos estén ‘offline’?
Requieren intervención manual o automática para ser accesibles, como en cintas magnéticas.
¿Qué es un índice agrupado?
Un índice donde los datos físicos se ordenan según el índice.
¿Cuál es la principal ventaja de un índice agrupado?
Mejora el rendimiento en consultas que requieren datos ordenados.
¿Cuál es la principal desventaja de los índices secundarios?
Requieren espacio adicional de almacenamiento.
¿Qué es la integridad referencial?
Garantiza que las relaciones entre tablas sean válidas y consistentes.
¿Qué es un constraint en bases de datos?
Una regla que restringe los valores permitidos en una columna o tabla.
¿Por qué no se deben crear demasiados índices?
Pueden impactar negativamente el rendimiento en operaciones de escritura.
¿Qué es la fragmentación de índices?
Desorganización física de las páginas del índice que puede afectar el rendimiento.
¿Qué es el área de staging?
Zona temporal para datos crudos antes de su transformación final.
¿Qué es un proceso ETL?
Extract, Transform, Load - proceso para mover datos de fuentes a un destino final.
¿Qué son los metadatos en un Data Warehouse?
Información sobre la estructura, significado y uso de los datos almacenados.