b2t5 - NoSQL Flashcards
En qué SQL se introdujo el concepto de Esquemas Flexibles con JSON?
En SQL 2016
Qué dos ventajas tiene NoSQL?
- Esquemas flexibles, tipo JSON por ej.
- Es altamente distribuido (SHARDING), por tanto podemos tener alta disponibilidad
Qué es SHARDING en NoSQL?
Es un particionamiento horizontal de los datos, en los sistemas altamente distribuidos como NoSQL
Qué desventajas tiene NoSQL?
- Latencia
- No garantizan totalmente ACID como las SQL transaccionales tradicionales (Atomicidad, Consistencia, Aislamiento, Durabilidad)
Qué significa el concepto BASE de SQL?
“Consistencia eventual”: Hay una latencia, por ser un entorno tan distribuido, en la consistencia de los datos, temporalmente.
En qué consiste el teorema CAP o de Brewer?
Dice que no se pueden garantizar a la vez las siguientes 3 características
- Consistencia: Todos los nodos ven la misma información
- Disponibilidad: Toda petición tiene que recibir una respuesta
- Tolerancia a la partición: Debe seguir funcionando ante fallos en las comunicaciones que segmenten la red de nodos
De las 3 características que contempla el teorema CAP, qué tipos de sistemas cumplen estas dos de sus partes?
CA
Nombra 3 productos
CA → Base de Datos relacinales (RDBMS) Oracle, mysql, postgreSQL, ….
De las 3 características que contempla el teorema CAP, qué tipos de sistemas cumplen estas dos de sus partes?
AP
Nombra 3 productos
AP → Cassandra, Riak, couchDB, simpleDB, Dynamo, voldemort
Suele tener arquitectura en anillo. Por la latencia de un nodo a otro se produce inconsistencia temporal
De las 3 características que contempla el teorema CAP, qué tipos de sistemas cumplen estas dos de sus partes?
CP
Nombra 3 productos
CP → Mongo DB, HBase, REDIS, BigTable (suelen ser arquitecturas con nodo MASTER, por eso si se cae no garantiza la disponibilidad)
En qué familias se pueden clasificar los sistemas NoSQL según su modelo de información?
- Documentos
- Familia Columnas
- Clave-valor
- Grafos
- Objetos
- XML
Nombra 7 productos de Sistemas NoSQL de la familia de DOCUMENTOS
- MongoDB
- CouchDB
- OrientDB *
- RavenDB
- TerraStore
- ArangoDB *
- Amazon DynamoDB *
* multi-modelo
Son colecciones de documentos (como JSON)
Nombra 4 productos de Sistemas NoSQL de la familia de Columnas
No todas las filas tienen las mismas columnas
- Cassandra
- HBase
- Hypertable
- Bigtable
Nombra 7 productos de Sistemas NoSQL de la familia de Clave-Valor
REDIS
RIAK
Voldemort
ArangoDB *
OrientDB *
Amazon DynamoDB *
SimpleDB
Nombra 7 productos de Sistemas NoSQL de la familia de Grafos
Son como las de Objetos, pero con algoritmos de grafos muy inteligentes
Neo4J
OrientDB *
FlockDB
InfiniteGraph
HyperGraphDB
ArangoDB *
AllegroGraph
Nombra 7 productos de Sistemas NoSQL de la familia de Objetos
ObjectStore
ZooDB
Versant
ObjectDB
JADE
Zope
Nombra 6 productos de Sistemas NoSQL de la familia de XML
Berkely DB XML
Apache X indice
BaseX
eXist
Sedna
Quizx
Qué 4 dimensiones tiene una BBDD de la familia de Columnas como Cassandra?
keyspace / ColumnFamily / Rowkey / Column
La column es el valor que tiene nombre de columna, valor y timestamp
Qué es el sistema de ficheros HDFS?
Hadoop distributed file system
Sistema de ficheros distribuida de Apache Hadoop
Qué es el concepto MAP REDUCE de Hadoop?
Es el proceso distribuido de grandes cantidades de datos: Cada nodo procesa una parte y luego junta los resultados
Qué es el YARN o MESOS de Hadoop
Es el gestor de recursos de Hadoop
Con qué producto se suele replicar datos entre Hadoop y NoSQL en el ecosistema BigData?
Kafka
Qué 3 principales librerías de consultas en hay en el ecosistema BigData?
Manhout → machine learning
PIG
HIVE
sparK
Qué es Hadoop?
Es una infraestructura para procesar BigData, de Apache
¿Que tipo de BBDD es MongoDB? ¿Que otros modelosNoSQL+producto(s) asociados conoces?
- Sigue el modelo documental (JSON)
- Modelos clave-valor, grafos, basado en columnas, etc. (Productos: Cassandra, Redis, Neo4j, …)
¿A que se refiere el estandar CMIS? ¿Cómo se llama el tipo de productos que lo implementan? ¿Existe equivalente en Java?
API Estandar (Servicios Web SOAP y REST) para acceder a CMS (en concreto gestores documentales como Alfresco, Documentum, etc) El API equivalente en Java es la JCR (Java Content Repository)
En las bases de datos orientadas a objeto, para cuantificar el movimiento existente entre la entrada a las bases de datos y la salida se emplean dos sistemas que se conocen como
Dinámica fuerte y dinámica débil
CODASYL, modelo de Sistemas Gestores de Bases de datos en red, es acrónimo de
Conference on Data Systems Languages