Arquitectura de datos Flashcards
Quiz
¿Qué tipos de datos se pueden analizar?
Estructurados, Semi Estructurados y No Estructurados
Características de los datos estructurados
Se almacenan en bases de datos relacionales (SQL) y Poseen un esquema predefinido (filas y columnas).
Ejemplos de datos estructurados
- Datos de transacciones bancarias
- Registros de clientes.
Características de los datos semiestructurados
No siguen un esquema rígido, pero tienen una organización parcial.
¿Cómo se almacenan los datos semiestructurados?
En formatos como JSON, SML, YAML
Ejemplos de datos semiestructurados
Documentos JSON en bases NoSQL y Logs de eventos
Características de datos no estructurados
No tienen un formato predefinido y son difíciles de almacenar en bases de datos
Ejemplos de datos no estructurados
Imágenes, videos, correos electrónicos y documentos de texto
Características de los archivos JSON
Ligero, fácil de leer para humanos y máquinas, ampliamente usado en APIs REST.
Características de los archivos XML
Verboso, estructurado con etiquetas anidadas, usado en integraciones empresariales
Características de los archivos YAML
Más legible para humanos, usa indentación en lugar de llaves o etiquetas, común en configuración de software
¿Qué tipo de procedencia pueden tener los datos?
Zero party data, 1st party data, 2nd party data, 3rd party data
Qué es Zero Party Data
Datos que el cliente da de forma voluntaria a la marca
Ejemplo de Zero Party Data
Encuestas y Formularios
Qué es 1st Party Data?
Datos recogidos por la compañía en su interacción con el cliente
Ejemplo de 1st Party Data
Compras
Qué es 2nd Party Data
1st party data de otra compañía con permisos para su uso mediante un acuerdo de partnership
Ejemplos de 2nd party data
Partnership bancos y seguros
Qué es 3rd party data?
Datos agregados recogidos sin el permiso explícito del usuario
Ejemplos de 3rd party data
Datos de movilidad para el sector público
¿Qué es una base de datos?
Sistema organizado para recopilar, almacenar y gestionar datos. Está diseñada para permitir el acceso rápido y seguro a grandes cantidades de información. Facilita la manipulación y análisis de los datos almacenados
Ejemplos de programas para bases de datos relacionales
MySQL, SQLserver, Amazon Aurora, PostgreSQL, SQLite
Tipos de bases de datos no relacionales
Documentales, clave-valor, columnas, grafos, vectoriales
Programas para bases de datos no relacionales
MongoDB, Cassandra, Amazon DynamoDB, NEO4J