Bloque2-Tema5-NoSQL Flashcards

1
Q

Que significa NoSQL?

A

Not Only SQL

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Cuales son las ventajas de los sistemas NoSQL?

A

-Productividad en desarrollo (Mejor ajuste al modelo relacional)-> (Esquemas flexibles y agregacion)

-Volumen de datos (Sistemas altamente distribuidos)-> Sharding

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Cuales son las desventajas de los sistemas NoSQL?

A

-No garantizan completamente ACID (Tienen consistencia Eventual) Pero si BASE

-Falta de madurez, experiencia y compatibilidad (Aun no hay estandares)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Que es el sharding?

A

Informacion distribuida en nodos. El sharding es una técnica informática por la cual se busca dividir una base de datos o red para hacer que su funcionamiento sea mucho más escalable y descentralizado.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Que es BASE refiriendo a sistemas NoSQL?

A

Basically Available Soft State Eventually Consistent

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Que dice el Teorema CAP o de Brewer?

A

Que de la Consistencia, Availability y Partition tolerance, solo se pueden cumplir 2 a la vez.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Que es la consistencia?

A

Que todos los nodos “ven” la misma informacion.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Que es la disponibilidad (Availability)?

A

Que toda peticion tiene que recibir una respuesta.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Que es partition tolerance?

A

El sistema debe seguir funcionando aunque haya fallos en las comunicaciones que segmenten la red de nodos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Que sistemas gestores de BD cumplen CA(Consistency y Availability)

A

los Sistemas gestores de bases de datos relacionales (RDBMS)

-Oracle
-MySQL
-PostgreSQL
-SQLServer
Etc

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Que sistemas gestores de BD cumplen AP (Availability y Partition Tolerance)

A

-Riak
-Voldemort
-Cassandra
-CouchDB
-SimpleDB
-Dynamo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Que sistemas gestores de DB cumplen CP (Consistency y Partition Tolerance)

A

-HBase
-MongoDB
-Redis
-BigTable

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hablando de sistemas SQL, clasificando segun modelo informacion (Como esta organizada la informacion) Cuales estan en la columna Documentos.

A

-MongoDB
-CouchDB
-RavenDB
-TerraStore

-OrientDB*
-ArangoDB*
-DynamoDB*

*-> Multimodelo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hablando de sistemas SQL, clasificando segun modelo informacion (Como esta organizada la informacion) Cuales estan en la columna Familia Columnas

A

-Cassandra
-HBase
-HyperTable
-BigTable

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hablando de sistemas SQL, clasificando segun modelo informacion (Como esta organizada la informacion) Cuales estan en la columna Clave-Valor

A

-Redis
-Riak
-Voldemort
-ArangoDB*
-OrientDB*
-DynamoDB*
-SimpleDB

*-MultiModelo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hablando de sistemas SQL, clasificando segun modelo informacion (Como esta organizada la informacion) Cuales estan en la columna grafos

A

-Neo4j
-FlockDB
-InfinityGraph
-HyperGraphDB

-OrientDB*
-ArangoDB(*)
-AllegroGraph

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Que caracteristicas principal define al modelo clave/valor NoSQL?

A

Que cada fila no tiene un numero de columnas fijo.

18
Q

En Redis(Clave/valor), cada clave tiene asociado un tipo de datos que puede ser:

A

-Strings (GET/SET)
-sets (SADD, SMEMBERS)
-lists (LPUSH, LRANGE)
-hashes (HMSET, HGET, HGETALL)

19
Q

En que modelo NoSQL existen properties tanto en nodos como en las relaciones?

A

Modelo Basado en grafos (Ej: Neo4J)

20
Q

Nombra alguno de los algoritmos implementados por el modelo basado en grafos NoSQL

A

-PageRank(Mide la influencia transitiva o la conectividad.
-Shortest Path con Dijkstra o A*
-Euclidean distance
-Strongly Connected components con Tarjan.

21
Q

como se llama a las conexiones entre grafos en el modelo basado en grafos?

A

Relationship o Edge

22
Q

Que modelo maneja colecciones de documentos(no hace falta definir esquema) con formato JSON?

A

Modelo documento (Ej. MongoDB)

23
Q

Que sentencias CRUD conoces?

A

-db.users.InsertOne (documento-> Se genera un campo_ID)

-db.users.find

-db.users.updateOne

-db.users.deleteMany

24
Q

Que modelo es desnormalizado?

A

El modelo basado en familias de columnas (Ej: Cassandra)

Cada columna va a tener un valor y un timestamp(indica el tiempo)

25
Q

Cuantas dimensiones tiene el modelo basado en familias de columnas? y cuales son?

A

4 dimensiones = [KeySpace[[ColumnFamily][RowKey][Column]

26
Q

Que es mahout?

A

Apache Mahout es un proyecto de Apache Software Foundation para producir implementaciones gratuitas de algoritmos de aprendizaje automático distribuidos o escalables centrados principalmente en el álgebra lineal.

Machine Learning.

27
Q

Que aplicaciones de consultas conoces?

A

-Pig
-Hive
-Spark SQL

28
Q

Que es Hadoop?

A

Sirve para programar aplicaciones distribuidas que manejen grandes volúmenes de datos.​

29
Q

Que es MapReduce?

A

mapea muchos nodos y reduce o trozea la informacion.

is a programming model and an associated implementation for processing and generating big data sets with a parallel, distributed algorithm on a cluster.

30
Q

Que es Apache kafka?

A

Es una plataforma distribuida para la transmisión de datos

31
Q

Que kernels administrador/gestor de cluster conoces?

A

-Hadoop Yarn

-Apache Mesos

32
Q

Que es HDFS?

A

HDFS es el sistema de ficheros distribuido de Hadoop.

33
Q

Paradigma Batch Processing

A

el objetivo era acumular todos los datos que se pudieran, procesarlos y producir resultados que se «empaquetaban» por lotes.

Solicitud por lotes

34
Q

Esquema relacion de otras tecnologias con BigData

A
35
Q

Que es gossip en Cassandra?

A

protocolo que permite a cada nodo realizar un seguimiento de la información de estado sobre los otros nodos en el clúster.

peer-to-peer communication protocol

36
Q

Como esta estructurado Cassandra?

A

En un anillo formado por los nodos.

37
Q

Esquema de mongoDB.

A
38
Q

Esquema de cassandra

A
39
Q

Puerto de MongoDB?

A

27017

40
Q

Puerto de CassandraDB?

A

9042