NoSQL Flashcards
En qué consiste SHARDING
Es la técnica para distribuir la información o datos en nodos de manera horizontal
Qué desventaja fundamental tiene NoSQL
No se garantiza completamente la transaccionalidad (ACID). Consistencia eventual (BASE)
En qué consiste el teorema CAP
Consistency (consistencia), Availability (disponibilidad), Partition Tolerance (tolerancia de partición)
No se puede garantizar simultáneamente las 3 propiedades
Sistemas Consistencia Availability (disponibilidad) (CA)
Todos los sistemas relacionales. No son distribuidos:
RDBMS (Oracle, MySQL, PostgreSQL, SQL Server, etc)
Sistemas Availability (disponibilidad) y Partition Tolerance (AP)
Riak, Cassandra, Couch DB, Simple DB, Dynamo, Voldemort
Sistemas Consistency y Partition Tolerance (CP)
HBase, MongoDB, REDIS, Big table
Suelen ser arquitecturas con nodo MASTER (por ESO son solo CP)
Sistemas de DOCUMENTOS en cuanto a la clasificación según el modelo de información
- Mongo DB
- Couch DB
- Orient DB
- Raven DB
Sistemas de FAMILIA COLUMNAS en cuanto a la clasificación según el modelo de información
- Cassandra
- HBase
- Hyper table
- Bigtable
Sistemas de CLAVE-VALOR en cuanto a la clasificación según el modelo de información
- REDIS
- RIAK
- Voldemort
Sistemas de GRAFOS en cuanto a la clasificación según el modelo de información
- Noe 4J
- Orient DB
- Infinity Graph
- Allegro Graph
Sistemas de OBJETOS en cuanto a la clasificación según el modelo de información
- ObjectStore
- Versant
- Object DB
Sistemas de XML en cuanto a la clasificación según el modelo de información
- Apache X índice
- Berkeley DB XML
¿Cual es el máximo exponente de BigData?
Hadoop. Es un software que tiene muchos datos distribuidos en muchos nodos y logra lanzar un algoritmo sobre todos ellos, con la técnica o modelo de programación MAP-REDUCE (divide y vence), y juntar los resultados.
Herramientas que están por encima de Hadoop para consultas
PIG, HIVE y Spark SQL
Herramientas que están por encima de Hadoop para consultas
PIG, HIVE y Spark SQL