Preparación de datos Flashcards

Aplicar técnicas de preparación de datos para manejar valores faltantes y subconjuntos de datos

You may prefer our related Brainscape-certified flashcards:
1
Q

¿Cuál es el proceso que precede a la preparación de los datos?

A

Inspección de datos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

¿Cuáles suelen ser las estrategias para dar manejo a los datos faltantes?

A

Omisión e imputación de datos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

¿Con qué otro nombre se le conoce a la estrategia de omisión de datos?

A

Análisis de caso completo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

¿En que consiste la estrategia de omisión de datos?

A

esta recomienda que las observaciones con valores perdidos se excluyan del análisis

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

¿Cuáles son las tareas más relevantes que se realizan en la preparación de los datos?

A

Manejo de valores faltantes.

Manejo de valores atípicos

Subconjuntos de datos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

¿Cuáles son los efectos indeseables que pueden producir los datos faltantes?

A
  • Pérdida de potencia estadística en el análisis a realizar con esos datos.
  • Puede introducir sesgos en el estudio.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

¿De acuerdo al material estudiado. Cuántas pueden ser la posibles causas de datos faltantes?

Jaggia, S., Kelly, A., Lertwachara, K., Chen, L.(2023). Analítica de Negocios. McGraw-Hill Interamericana. https://recursosdigitales.usb.edu.co:2168/?il=26249

A

Pueden ser cinco (5) causas

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

De acuerdo con el material estudiado ¿Cuáles son las causas de datos faltantes en un conjunto de datos?

Jaggia, S., Kelly, A., Lertwachara, K., Chen, L.(2023). Analítica de Negocios. McGraw-Hill Interamericana.

A
  1. Encuestados que se niegan a proporcionar la información debido a su naturaleza confidencial.
  2. Algunos elementos de una encuesta no aplican a todos los encuestados.
  3. Errores humanos en recopilación o tabulación de los datos.
  4. Fallas en el equipo de medición.
  5. Fallas en el procedimiento de recopilación.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

¿Qué son datos atípicos?

A

Son valores extremadamente pequeños o grandes, en relación al dominio de la variable respecto a los valores de las demás observaciones.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

¿A qué se le denomina creación de subconjuntos en la preparación de datos?

A

Al proceso de extraer porciones de un conjunto de datos que son relevantes para el análisis.

La creación de subconjuntos es el proceso de extraer partes de un conjunto de datos que son de interés para el profesional de la analítica

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

¿En que consiste la imputación de datos?

A

La estrategia de imputación reemplaza los valores faltantes con algunos valores imputados razonables.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

¿Cuál es la estrategia de imputación más utilizada para variables numéricas?

A

Imputación por medias simple

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

¿Cuál es la estrategia de imputación más utilizada para variables categóricas?

A

a menudo se utiliza la categoría más frecuente como valor imputado

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

A la hora de excluir variables de un conjunto de datos ¿Cuántos factores podría tenerse en cuenta?

A

Cuatro factores

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

¿Cuáles son los factores para decidir quitar una variable de un Dataset?

A
  1. Variables Irrelevantes para el problema.
  2. Variables con información redundante.
  3. Variables que sean una combinación lineal de otra variable.
  4. Variables con cantidades excesivas de valores faltantes.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Además de agrupar por rangos de valores o categorías intrínsecas en el dataset ¿Cómo podría crear un subconjunto a partir del criterio del analista? (son dos)

A
  1. Creando escalas de desempeño.
  2. Creando categorías binarias (éxito/fracaso) a partir de un parámetro.