Entrega 1 Flashcards
¿Qué es Hadoop?
Es una estructura de software de código abierto para almacenar datos y ejecutar aplicaciones en clústeres de hardware comercial. Proporciona almacenamiento masivo para cualquier tipo de datos, enorme poder de procesamiento y la capacidad de procesar tareas o trabajos concurrentes virtualmente ilimitados.
¿Por cuantos modulos se compone Hadoop?
4 modulos
¿Cuáles son los modulos?
- Sistema de archivos distribuido
- MapReduce
- Hadoop comun
- YARN
¿Por quien fue creado Hadoop?
Doug Cutting
Son las librerías y utilidades que utilizan otros módulos de Hadoop.
Hadoop comun/ comunes de hadoop
Es el sistema escalable basado en Java que almacena datos en múltiples máquinas sin organización previa.
Sistema de archivos distribuido
Ofrece gestión de recursos para los procesos que se ejecutan en Hadoop.
YARN
Es la estructura de software de procesamiento en paralelo.
MapReduce
¿Por qué es importante Hadoop?
Capacidad de almacenar y procesar enormes cantidades de cualquier tipo de datos, al instante. Poder de cómputo Tolerancia a fallos Flexibilidad Bajo costo Escalabilidad
¿De que sirve el soporte de SAS a implementaciones del big data, incluyendo Hadoop?
Ayudarle a saber más en menos tiempo, de modo que pueda tomar mejores decisiones, eso incluye preparación y gestión de datos, visualización y exploración de datos, desarrollo de modelos analíticos, implementación y monitoreo de modelos.