Dataware house Flashcards
Ecosistema Hadoop
Zookeeper
Herramienta de sincronización
Ecosistema Hadoop
STORM
marco de cálculo de procesamiento de flujo distribuido
Ecosistema Hadoop
Lucene
Api codigo abierto para recuperar información
Ecosistema Hadoop
Chukwa
Sistema de recogida de datos
Ecosistema Hadoop
Sqoop
Herramienta de ETL (extracción, transformación y carga o actualización)
Ecosistema Hadoop
Mahout
Plataforma de datamining
Ecosistema Hadoop
Hive
El datawarehouse
Ecosistema Hadoop
Pig
Leng de alto nivel para MapReduce
Ecosistema Hadoop
PigLatin
Leng de flujos de datos
Ecosistema Hadoop
Flume
Agregador de logs
Ecosistema Hadoop
HBASE
Gestor de BD NOSql
CP
Ecosistema Hadoop
Kafka
Plataforma para la manipulación en tiempo real de fuentes de datos
Ecosistema Hadoop
Spark
Computación en clúster
Ecosistema Hadoop
Oozie
Sistema de orquestación de flujos de trabajo
BD NoSQL MongoDB orientada a
Documentos CP Escrita en C++
BSON
CouchDB orientada a
Documentos AP
RavenDB orientada a
Documentos
Cassandra orientada a
Híbrido Columnas y Clave-valor
Desarrollado inicialmente por Facebook
AP
CQL similar a SQL
HBase orientada a
Columnas
CP
Orache NoSql orientada a
Clave-valor
Dynamo orientada a
Clave-valor AP
Redis orientada a
Clave-valor CP
Todo funciona en memoria
Para persistir:
- RDB snapshots de la BD
- AOF append of file, guarda un log
Java: Redis
c: hierdis
Python: redis-py
Comandos básicos de consulta: set, get, keys
Infinite graph orientada a
Grafo
Neo4j orientada a
Grafo
Zope orientada a
Objetos
Gemstone orientada a
Objetos