Teoría (presentación) Flashcards
Cuando las variables son MAR (missing at random) que tratamiento se les da
Imputación de uno o varios datos
Cuales son los datos que son MCAR (missing completely at random)
La falta de datos no depende de la categoría ni el valor de los datos
Cuales son los datos que son MAR (missing at random)
La falta de datos depende
de algunos valores en las
categorías, pero no del
valor de todos los datos
Cuando las variables son MCAR (missing completely at random) que tratamiento se les da
Eliminación de columnas o filas
que puedo saber con un boxplot
valor mas bajo, primer cuartil, mediana, tercer cuartil, valor mas alto y rango
cual es la imputación simple
Por media o regresión
cuales son los contras de la imputación simple
las medidas de dispersión se ven
afectadas
que es la estadística descriptiva
organizar y
resumir datos
que es la estadística inferencial
Toma de decisión respecto a un gran volumen de información
datos crudos
datos sin procesar u orden
Medida descriptiva
Dato individual que incluya información importante acerca de los datos crudos
Donde puedo ver el resumen de cuántos datos caen en cada
intervalo?
Tabla de distribución de frecuencias
Medidas de tendencia central
La media aritmética
(Es única, simplicidad, es afectada por cada valor)
La mediana
Las moda (Es única, Simplicidad, No es afectada por valores
extremos)
Medidas de dispersión
Rango (Diferencia entre el valor mas pequeño y el mas grande)
Varianza. (La dispersión de los valores alrededor de su media)
Desviación estándar (La variancia representa en términos de las unidades originales)
Coeficiente de variación (Es una medida de variancia relativa para comparar diferentes población)
para qué es la normalización y escalamiento?
para poder observar los datos gráficamente de mejor manera