examen Flashcards
¿Que comando se utiliza para extraer datos de una tabla?
SELECT
¿Que comando se utiliza para actualizar registros en una tabla?
UPDATE
¿Que comando se usa para borrar registros en una tabla?
DELETE
¿Cual de las siguientes sentencias selecciona todas las columnas de la tabla clientes?
SELECT * FROM clientes
¿Cual selecciona todos los registros de la tabla clientes donde el valor de la columna nombre empieza por a?
SELECT * FROM clientes WHERE nombres like ‘a%’
¿Que comando devuelve valores distintos?
SELECT DISTINCT
¿Que comandos se usa para ordenar los resultados?
ORDER BY
¿Que operador selecciona valores en un rango?
BETWEEN
¿Que devuelve SELECT sum(a),b from table GROUP BY b?
Un registro con la suma de a para cada valor de b
Sqoop puede tener como origen de datos:
“MySQL, HDFS o Hive”
Que tipo de proceso es Sqoop?
Sqoop es un proceso BATCH
Si ejecutamos un import a HDFS con un target-dir que ya existe previamente:
Da un error y no se lanza el job
El número de map por defecto que se lanzan en un job es:
4
Al hacer un import a HDFS de un JOIN de tablas si no especifico –split-by entonces el valor de –m tiene que ser:
1
Sqoop es un proceso de la comunidad de
APACHE
En el caso de lanzar un job de sqoop con 10 mappers se generarán:
Un número de ficheros dependiendo de los valores distintos de la columna del split-by
Para poder usar la opción de incrementar append en sqoop la tabla origen tiene que tener:
Una columna incremental que se actualice en cada insert
Donde se procesa cada split dedatos que genera Sqoop?
los procesa en HADOOP
En el caso de ejecutar un job de Sqoop con 4 tareas map el numero de reducers será:
0
Hive es una herramienta de procesamiento,
BATCH
El lenguaje que se utiliza en Hive es:
HQL
Una managed table de Hive se almacena por defecto
EN EL WAREHOUSE DE HIVE
Al borrar una managed table se borran los metadatos de la tabla
EN EL METASTORE DE HIVE
Un regexSerde se puede aplicar al siguiente tipo de formato de almacenamiento:
TEXTFILE
El formato PARQUET:
Es un formato orientado a COLUMNAS
Un nivel de partición es:
Un directorio de HDFS
Si quiero añadir una librería a Hive externa a Hive, tengo que ejecutar el comando
ADD JAR