Big Data Flashcards

1
Q

Hadoop HDFS

A

Hadoop Distributed File System -> Sistema de ficheros distribuidos
MODULO PRINCIPAL

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hadoop YARN

A

Marco de trabajo para planificación y gestión de recursos de clúster
MODULO PRINCIPAL

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hadoop Common

A

Utilidades comunes

MODULO PRINCIPAL

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Apache PIG

A

Plataforma de análisis de datos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Apache Hive

A

sistema de almacenamiento de datos que proporciona acceso a los archivos almacenados en distintas fuentes, herramientas ETL, etc.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Apache Zookeeper

A

Sistema para coordinación de diferentes servicios en aplicaciones distribuidas

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Apache Kafka

A

Sistema de mensajería distribuido de alto rendimiento.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Apache Storm

A

Framework para el procesamiento de flujos distribuidos, transformando Hadoop en un sistema de tiempo real

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Apache Spark

A

Framework que proporciona una interfaz para la programación de clústeres completos con paralelismo de datos y tolerancia a fallos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

JobTracker

A

Servidor maestro en el paradigma Map/Reduce

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

TaskTracker

A

Servidor esclavo en el paradigma MapReduce

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Flume

A

Tecnología orientada a la recopilación de datos desde su origen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Sqoop

A

Tecnología orientada a la recopilación de datos desde su origen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Cassandra

A

Tecnología para guardar y gestionar grandes volúmenes de datos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

MongoDB

A

sistema de BBDD noSQL orientado a documentos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Apache Mesos

A

Kernel administrador de clúster para manejo de recursos y planificación de tareas de todo el data center

17
Q

Apache MapReduce

A

Para procesamiento paralelo de muchos datos

18
Q

RabbitMQ

A

Intercambio de datos entre los diferentes componentes software mediante stream o mensajes

19
Q

ActiveMQ

A

Intercambio de datos entre los diferentes componentes software mediante stream o mensajes