Transformación de datos Flashcards

Transformar datos, respecto a su formato

1
Q

¿Qué es la transformación de datos?

A

es el proceso de convertir datos de un formato o estructura a otro.
Se realiza para cumplir con los requisitos de las técnicas estadísticas y de minería de datos utilizadas para el análisis.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

De acuerdo con el texto consultado.

¿Qué tres opciones de transformación de datos se pueden utilizar?

A
  1. Variables numéricas en variables categóricas.
  2. Transformaciones matemáticas entre variables numéricas.
  3. Transformación de variables categóricas.

Jaggia, S., Kelly, A., Lertwachara, K., Chen, L.(2023). Analítica de Negocios. McGraw-Hill Interamericana. https://recursosdigitales.usb.edu.co:2168/?il=26249

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

¿A qué hace referencia el término Agrupación o Binning en la transformación de datos?

A

La agrupación es una técnica común de transformación de datos que convierte variables numéricas en variables categóricas, agrupando los valores numéricos en una pequeña cantidad de intervalos o contenedores (bins)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

¿Qué es una transformación matemática?

A

Consiste en crear nuevas variables a través de transformaciones matemáticas de variables existentes, mediante el uso de procedimientos u operaciones.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

¿Qué problema puede existir en el caso de variables ordinales o nominales?

A

Qué tengan demasiadas categorías, que sean redundantes, poco representativas o no indiquen un aspecto relevante acerca de la población.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

¿Cuál es el nombre de la técnica que permite resolver casos en donde hayan demasiadas categorías en una variable cualitativa?

A

Reducción de categorías

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

¿Cuál es la traducción al inglés de la técnica variables indicadoras para la transformación de variables cualitativas?

A

Dummy Variable

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

¿Para que se recomienda la utilización de la técnica de variables indicadoras?

A

Se utiliza cuando se necesita que las variables categóricas asuman valores numéricos para poder ser empleados dentro de modelos matemáticos para predicción, análisis o proyección de una situación o negocio

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

¿Qué es una variable indicadora?

A

Una variable indicadora (dummy variable) (también conocida como variable binaria) toma valores de 1 o 0 para describir dos categorías de una variable categórica.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

¿Qué hacer cuando se desea utilizar la técnica de variables indicadoras pero la variable cualitativa tiene más de dos categorías diferentes?

A

Por ejemplo, el modo de transporte utilizado para ir al trabajo puede describirse en tres categorías: Transporte público, Conducción solitaria y Uso común de auto. Dadas k categorías de una variable, la regla general es crear k − 1 variables indicadoras, usando la última categoría como referencia. Para el ejemplo del modo de transporte, solo necesitamos definir dos variables indicadoras. Suponga que definimos dos variables indicadoras d1y d2, donde d1es igual a 1 para transporte público, 0 en caso contrario, y d2 es igual a 1 para conducción solitaria, 0 en caso contrario. Aquí, la categoría de referencia Uso común de auto se indica cuando d1= d2= 0. Por lo tanto, agregar la tercera variable ficticia para Uso común de auto crearía redundancia de información.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly