Actividades Flashcards
que tipos de variables hay
categórica codificada o no (si no, tal vez, etc.) ,Numérica continuas (muchos decimales, ej. precios) o discretas (números enteros, como personas)
cómo se imputa por moda?
cuentas cuantas repuestas hay de cada categoría, y hacer una matriz de probabilidades con los rangos del 0-1, uso la funcion buscar v
que tipo de variable se puede imputar por moda
las categóricas o las numéricas discretas
cómo se imputa por media?
se saca el promedio y la desviación estándar, y los usas para la funcion de inv.norm
que tipo de variable se puede imputar por media
variables numéricas continuas
como podemos saber si una variable sigue el comportamiento de una distribución normal visualmente
Podemos usar el boxplot y observar si la media (representada por una cruz) y la mediana (la línea central) coinciden.
como puedo ver mejor las frecuencias visualmente
gráficas de barras
como podemos saber si una variable sigue el comportamiento de una distribución normal precisamente
ver que tan diferente es el coeficiente de asimetría en la función de Data Analysis de cero
como creo los histogramas para variables numéricas
primero creo la matriz “bins”, comenzando con un un rango inicial, restando el valor máximo y el mínimo, y dividiéndolo entre la cant. de columnas que querramos. Luego, este rango unitario se multiplicará por el número de columna correspondiente y después se usara la herramienta Análisis de Datos, empleando la función de Histograma
que son los outliers
Los outliers son datos que se encuentran fuera del rango estadístico esperado y pueden observarse fácilmente utilizando un diagrama de caja.