Machine learning Flashcards

1
Q

¿Qué es un array o lista?

A

Almacenar una colección de datos ordenados por medio de un índice

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Machine Learning

A

Es una rama de la inteligencia artificial.
Es un sistema complejo que aprende y mejora su respuesta con los datos que recibe de entrada.
Algoritmos y técnicas que permiten a las computadoras aprender y mejorar su desempeño en tareas específicas a partir de datos, sin necesidad de programación explícita para cada acción.
Se basa en el concepto de que las máquinas pueden aprender patrones, reconocer tendencias y tomar decisiones con mínima intervención humana, utilizando modelos y algoritmos que se entrenan con conjuntos de datos para hacer predicciones o tomar decisiones basadas en esa información.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

¿Cómo funciona el proceso de aprendizaje de Machine learning?

A

Se le dan datos, instrucciones y ejemplos para que el programa comience a interpretar patrones y con esto tome decisiones con la información que tiene.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Ejemplos de algoritmos de aprendizaje

A
  • Supervised machine learning algorithms (Algoritmos supervisados de ML)
  • Unsupervised machine learning algorithms (Algoritmos no supervisados de ML)
  • Semi-supervised machine learning algorithms (Algoritmos semi-supervisados de ML)
  • Reinforcement machine learning algorithms (Algoritmos de aprendizaje por refuerzo)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Supervised machine learning algorithms (Algoritmos supervisados de ML)

A

Aprenden a través de datos etiquetados.
Usan data histórica.
Tienen datos de entrada y salida .
Tienen una función para asignar etiquetas a los datos de salida.
sirven para clasificación y regresión.
Ejemplos: mails de spam, detección de fraude de identidad (clasificación), predicción del clima (regresión).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Unsupervised machine learning algorithms (Algoritmos no supervisados de ML)

A

No tienen datos etiquetados.
Tratan de encontrar patrones, estructuras e inferencias de la data.
Ejemplo: agrupamiento de clientes basado en patrones de compra.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Semi-supervised machine learning algorithms (Algoritmos semi-supervisados de ML)

A

Tienen una pequeña cantidad de datos etiquetados.
Para realizar predicciones.
Ejemplo: análisis de redes sociales dónde se tiene alguna información etiquetada y se intenta predecir otras relaciones entre usuarios basadas en esta información limitada.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Algoritmos de aprendizaje por refuerzo (Reinforcement Learning Algorithms)

A

Aprenden a través de la interacción con su entorno (ensayo y error).
Toman decisiones y reciben retroalimentación (castigos y recompensas).
Ejemplo: los juegos, el programa aprende a tomar decisiones para maximizar su recompensa.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

¿Qué es una derivada?

A

Una derivada es una razón de cambio.
Una derivada nos dice que tantos cambios hay entre dos puntos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

¿Para qué sirven las matemáticas?

A

Son una herramienta para traducir fenómenos del mundo real e insertarlos en las computadoras.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

¿Qué es un mínimo local?

A

Cuándo el sistema no ha aprendido eficazmente y se estanca (el error no se reduce. cero). No sirve porque la AI puede fallar mucho.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Distancia euclidiana

A

La medida de la distancia entre dos puntos en un espacio euclidiano.

La distancia es la resta entre dos puntos.
Pero se elevan al cuadrado y luego se saca la raín cuadrada para trabajar con positivos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

¿Qué es un descriptor en ML?

A

Es la representación numérica (o simbólica) de una caracteristica específica de un dato o entidad.

La idea es usar un formato que pueda ser procesado por los algoritmos de aprendizaje automático.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

¿Qué es overfitting?

A

Cuando entrenas de más un modelo y ya es incapaz de predecir. (ejemplo de aprenderse las preguntas exactas para un examen)

Good performance on the training data, poor generliazation to other data.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

¿Qué es Underfitting?

A

No entrenar lo suficiente el modelo.

Poor performance on the training data and poor generalization to other data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

¿Qué es generalización?

A

Capacidad de un modelo entrenado para hacer predicciones precisas o tomar decisiones acertadas con datos nuevos que nunca ha visto antes.

17
Q

¿Qué significa la función Y = f(X)?

A

Una función (f) que usa las cosas en X para determinar o predecir lo que sucede en Y.

18
Q

¿Qué es Statistical Fit? (Ajuste estadístico)

A

Medida cuantitativa de qué tan bien el modelo se ajusta a los datos con los que fue entrenado y cómo se desempeña al hacer predicciones en datos nuevos o no vistos.

Un modelo con un buen ajuste es aquel que puede predecir con precisión los datos con los que fue entrenado y que tiene la capacidad de hacer predicciones útiles y certeras en nuevos conjuntos de datos.

19
Q

¿Qué es un dataset de validación?

A

Un conjunto de datos que se retuvo para probar el modelo después del entrenamiento.

20
Q

¿Qué son las resampling techniques o técnicas de remuestreo?

A

Son técnicas útiles para evitar el sobre entrenamiento. En una técnica de remuestreo, (como la validación cruzada k-fold), se dividen los datos en conjuntos de entrenamiento y prueba repetidamente para evaluar el rendimiento del modelo en diferentes subconjuntos de datos.

21
Q

¿Qué es una falacia?

A

Un argumento que parece lógico o verdadero, pero en realidad es incorrecto.

22
Q

¿Qué es la validación cruzada?

A

Cuando se rotan los datos entre entrenamiento y prueba. Ayuda a evitar el cherry picking.

23
Q

¿Qué es la validación cruzada K-fold?

A

El método k-fold es una técnica específica de validación cruzada en la que los datos se dividen en k subconjuntos (llamados “folds”) del mismo tamaño. Luego, el modelo se entrena k veces, cada vez utilizando k-1 de esos subconjuntos como datos de entrenamiento y uno como datos de prueba. El rendimiento del modelo se calcula como el promedio de los resultados obtenidos en cada iteración.

24
Q

¿Qué es una matriz de confusión?

A

Es una tabla que muestra la cantidad de predicciones correctas e incorrectas hechas por un modelo en comparación con los valores reales en un problema de clasificación.

25
Q

Train, Validation and Test

A

Se refiere a la división de un conjunto de datos en tres partes principales.