AI, ML y Analítica Flashcards

1
Q

¿Qué es Redshift?

A

Servicio de AWS para almacén de datos, es básicamente el servicio que permite almacenar una gran cantidad de datos con los que luego poder realizar operaciones de negocio para reportes y análisis.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Beneficios de Redshift

A
  1. Es una solución de almacén de datos totalmente gestionable
  2. Permite MPP (Massive Parallel Processing) - permite realizar queries complejas de forma paralela.
  3. Gestión de datos automática - Backup, replicación y escalado sin downtime.
  4. Diseñado para OLAP (Online Analytical Processing) - Buena solución para análisis y reporte
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

¿Qué es Redshift Serverless?

A

Versión de Redshift serverless, de forma que no se tiene que gestionar la infraestructura que hay por debajo para la solución.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

¿Qué es Kinesis?

A

Familia se servicios de AWS para recolectar, procesar y analizar datos en streaming. Como puede ser reportes de IoT, información de finanzas o acciones.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

¿Que tipos hay de Kinesis Streams?

A
  1. Data streams - Para el streaming de datos.
  2. Video streams - Para el streaming de video.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

¿Que es Kinesis Firehose?

A

Servicio de AWS de la familia Kinesis que permite recolectar, transformar y almacenar datos en streaming (realizar ETL) .

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Beneficios de usar Kinesis Firehose

A
  1. Se ajusta de forma dinámica según el volumen de datos.
  2. Procesa y envía la información antes de 60 segundos para mantener el tiempo real.
  3. Se puede transformar los datos con Lambda.
  4. Monitorización integrada con Cloudwatch y reintentos por error.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

¿En qué se diferencia Kinesis Firehose y Kinesis streams?

A
  1. Firehose no tiene retención de ningún tipo mientras que Streams tiene los shards para almacenar la información 24 horas.
  2. Firehose se usa cuando se requiere una transformación de los datos que se recolecta.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

¿Qué es Amazon Athena?

A

Servicio de AWS que permite lanzar queries SQL contra información que se encuentra en S3. Es un servicio serverless por lo que no hay que configurar nada, únicamente se paga por query y TB de datos obtenidos. Casos de uso serían analizar logs que estén en S3, analizar el uso y coste de la infra o generar reportes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

¿Qué es Amazon Glue?

A

Servicio de AWS que sirve para realizar operaciones de ETL usando varios puntos de origen de datos para tareas de análisis y ML. Genera un catálogo de datos donde registra metadatos de los datos (tipo, formato, etc) para luego poder extraer información de un origen, transformarla (enriquecerla, eliminar duplicados, anonimizarlo) y guardarlo en una solución de almacén de datos como S3, Redshift, RDS o Athena.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

¿Qué es Amazon Data exchange?

A

Servicio de AWS que permite intercambiar y hacer uso de datasets de terceros usando un modelo de subscripción, de forma que se puede obtener información de campos como finanzas, medicina, GPS de forma anómima para usarlo en ML, análisis y toma de decisiones.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

¿Qué es Amazon Elastic Map Reduce (EMR) ?

A

Servicio de AWS de Big Data gestionado que permite realizar operaciones de análisis complejo y paralelo sobre PB de datos ya sean estructurados, semiestructurados o no estructurados. Además soporta soluciones OpenSource como Hadoop, Apache Spark y Hive y Presto.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

¿Qué es Amazon Open search?

A

Servicio de AWS que ofrece un Elastic Search gestionado que permite analizar gran cantidad de datos para toma de decisiones, normalmente para análisis de logs generados. Se puede conectar a soluciones de inserto de logs como Logstash y de visualización de estos como Kibana, pero también se puede generar logs desde Cloudwatch, Firehose o Lambda (generando logs sobre otros servicios).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

¿Qué es Amazon Quicksight?

A

Servicio de AWS que ofrece un analizador de mercado como SaaS permitiendo cargar datos tanto de AWS como On premise y generar todo tipo de diagramas en los dashboard que se creen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Posibles casos de uso para Quicksight

A
  1. Análisis del mercado sobre qué productos se consumen más o qué modas existen.
  2. Análisis de la aplicación para comprobar cuántas peticiones llegan en qué horario o cuántos usuarios máximos se registran.
  3. Análisis de marketing para posibles campañas.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

¿Qué es Amazon MSK?

A

Servicio de AWS que ofrece un Apache Kafka como SaaS (Managed Streaming for Apache Kafka) que permite procesar flujos de eventos de cientos de origenes y procesarlos en orden para crear aplicaciones de procesamiento de datos en tiempo real.

15
Q

¿Qué es AWS SageMaker?

A

Servicio de AWS que ofrece una plataforma totalmente gestionada para Machine Learning.

16
Q

¿Qué ofrece AWS SageMaker?

A
  1. Importación de los datos desde puntos de AWS como S3, Athena, Redshift o EMR, además del proceso de preparación de estos (encontrando posibles errores y problemas de calidad)
  2. Construcción del modelo, ofreciendo modelos ya creados para problemas comunes y permitiendo crear personalizados.
  3. Entrenamiento del modelo usando infraestructura optimizada.
  4. Despliegue del modelo ya sea en instancias EC2, opción serverless o directamente en on premise.
17
Q

¿Qué es AWS Kendra?

A

Servicio de AWS que permite realizar búsquedas sobre datos semi estructurados o no estructurados utilizando lenguaje natural (NPL) en vez de un lenguaje programado.

18
Q

¿Qué orígenes pueden tener los datos en AWS Kendra?

A
  1. S3 o FSx
  2. Bases de datos como RDS, Aurora, Oracle, SQL Server
  3. Páginas web
  4. Puntos externos como drive o Github
19
Q

¿Qué tipos de queries se pueden hacer a AWS Kendra?

A
  1. Basadas en hechos - preguntas concretas sobre cómo, dónde, qué o cuándo.
  2. Descriptivas - preguntas más abiertas cuya respuesta es con más texto.
20
Q

¿Qué es AWS Lex?

A

Servicio de AWS que permite crear chatbots usando machine learning y modelos de lenguaje natural para integralos en diferentes plataformas (movil, web, …).

21
Q

¿Qué es AWS Polly?

A

Servicio de AWS que permite convertir texto en un audio leído por IA usando una lectura natural, además permite descargarlo como fichero o almacenarlo en S3.

22
Q

¿Qué es AWS Comprehend?

A

Servicio de AWS que permite la lectura y análisis de información en texto mediante NLP y, de esta forma, poder obtener palabras o frases clave, temas y lenguaje y realizar análisis del sentimiento y poder ofrecer una búsqueda más inteligente que tenga en cuenta estos factores y no solo una palabra en plano.

23
Q

¿Qué es AWS Textract?

A

Servicio de AWS que usa ML para análisis de documentos y extracción de información de estos. Puede usarse en varios tipos de documentos como imagenes, formularios, PDFs y puede ser texto digital o a mano.

24
Q

¿Qué es AWS Transcribe?

A

Servicio de AWS que usa ML para convertir voz en texto ya sea en streaming o con un fichero que se suba.

25
Q

¿Qué es AWS Translate?

A

Servicio de AWS que usa ML para traducción ya sea en tiempo real o en diferido. Soporta más de 70 lenguajes y además está preparado para trabajar con grandes cantidades de información pudiendo completar la transcripción en una única llamada a la API.

26
Q

¿Qué es AWS Rekognition?

A

Servicio de AWS que usa ML para análisis de imágenes o videos de forma que se puede usar para moderación de contenido, comprobación o verificación de identidades o incluso detectar texto u objetos.