BLOQUE 2 - TEMA 5 - Sistemas gestores bbdd NoSQL Flashcards
Las bbdd NoSql garantizan el modelo ACID ?
NO
consistencia eventual, se tarda un poco en que todos los nodos tengan la misma información
Que es el modelo BASE en las bbdd NoSql ?
BASE (Basically Available Soft State) - Consistencia eventual
Basically Available: El sistema debe garantizar cierto nivel de disponibilidad-
Soft state: se prioriza la propagación de datos, delegando el control de inconsistencias a elementos externos
Eventually consistent: Este principio establece que, con el tiempo, el sistema convergerá a un estado coherente.
Que es el teorema de CAP ( o conjetura de wreber)
Es un teorema que indica que es imposible para un sistema de cómputo distribuido garantizar simultáneamente: la consistencia(Consistency), disponibilidad(Availability) y la tolerancia al particionado (Partition Tolerance)
Dime las siglas de CAP del teorema de CAP (o teorema de wreber)
C : consistency
A: availability
P: partition tolerance
Cual es la definicion de los estados del teorema de CAP ? (o teorema de wreber)
C: consistency = Todos los nodos ven la misma información
A: availability = Toda petición tiene que recibir una respuesta
P: partition tolerance = El sistema debe seguir funcionando aunque haya fallos de comunicaciones entre nodos
Que 2 propiedades del teorema de CAP o teorema de wreber cumplen las bases de datos relacionales ?
Las 2 primeras, CA
C: consistency
A: availability
La ultima, la P (partition tolerance - el sistema debe seguir funcionando aunque haya fallos de comunicaciones entre nodos), NO la cumple
Dime una base de datos NoSQL de tipo clave-valor
Cassandra
Dime una base de datos NoSQL de tipo documental
MongoDB
nota: Modelo de documento almacena datos en forma de documentos, que suelen estar en formato JSON, BSON o XML.
Que es un BSON ?
BSON (binary JSON) - es un json en formato binario
Dime una base de datos NoSQL basada en grafos
neo4j
¿Cuáles son las cuatro operaciones básicas que se pueden realizar en una base de datos?
CRUD (Create, Read, Update, Delete).
Dime algunas sentencias de mongoDB (modelo NoSQL documental)
insertOne() o insertMany()
find()
updateOne(), updateMany() o replaceOne().
deleteOne() o deleteMany()
Que es lo que define la arquitectura de MongoDB (modelo NoSQL documentos)
Son arquitecturas con un nodo master
Cuales son las 7 V´s del big data ?
Volumen
Variedad
Velocidad
Veracidad
Valor
Variabilidad
Visualización
Que es hadoop ?
Hadoop es un marco de software de código abierto que facilita el procesamiento y almacenamiento de grandes conjuntos de datos en un entorno distribuido. Fue creado por Apache Software Foundation y es ampliamente utilizado en el mundo del big data.
Componentes Principales de Hadoop:
Hadoop Distributed File System (HDFS):
Función: Proporciona almacenamiento de datos distribuido y altamente escalable. Divide los datos en bloques grandes y los distribuye en diferentes nodos en el clúster.
Ventaja: Alta disponibilidad y resistencia a fallos, ya que los datos se replican en varios nodos.
MapReduce:
Función: Un modelo de programación para procesar grandes cantidades de datos de manera paralela en el clúster Hadoop.
Proceso: Divide el trabajo en tareas más pequeñas (Map) que se procesan en paralelo y luego combina los resultados (Reduce).
YARN (Yet Another Resource Negotiator):
Función: Administra los recursos del clúster y programa las tareas de procesamiento.
Beneficio: Permite ejecutar diferentes tipos de trabajos (no solo MapReduce) en el clúster.
Hadoop Common:
Función: Proporciona las bibliotecas y utilidades necesarias para que otros módulos de Hadoop funcionen.