Clase 2 Flashcards
Estadística descriptiva e inferencial.
La estadística descriptiva es aquella que busca describir una masa de datos mediante variables aleatorias, que se denominan así dado que cambian de momento en momento y sin un patrón predecible ni determinado.
Luego la inferencial busca comprender pobleaciones mediante el estudio de muestras, extrapolando esas muestras al total de la población.
Variables aleatorias discretas y continuas, transversales y longitudinales.
Las variables aleatorias que se modifican de momento en momento sin patrones predecibles pueden ser:
Según su naturaleza:
- Discretas: Toman un número finito determinado.
- Continua: Toma valores infinitos (intervalos)
Según tiempo:
- Transversal: Toma un valor determinado transversal al momento (PBI de los países en el año 2022)
- Longitudinal: Puede ver su variación en el tiempo (crecimiento del PBI de un país en una década).
Media
La media es el promedio de los datos.
Se trata de la media aritmética de los mismos.
Podríamos decir que es el valor esperado de la variable.
Medidas de dispersión
Nos permiten analizar las variaciones entre los valores de la muestra y la media para ver qué tan dispersos pueden ser los mismos.
Para ello debemos analizar la varianza que es producto de las sumatoria de las distancias entre los puntos y la media.
Y por último el desvío estandar, que es finalmente el indicador de volatilidad que se utiliza para analizar la volatilidad.
medida de asimetría
La asimetría nos permite ver hacia qué lado de la media se encuentran la mayoría de los datos.
Si es positivo, los datos se concentran hacia la derecha de la madia.
Si es negativo hacia la izquierda.
Si es cero, entonces se concentran de la misma forma.
Medida de curtosis
La curtosis nos permite ver qué tan puntiaguda es la función.
En una distribución normal perfecta, la curtosis es igual a 3.
Si toma valores mayores, etonces los valores se concentran más en torno a la media y se puede decir que es leptocúrtica.
Si es menor, toma forma platicúrtica.
Medidas robustas
Dado que algunas variables pueden tomar valores muy alejados de la media, podemos realizar análisis con medidas robustas que nos permiten analizar de forma indistinta a los outliers, que afectan a la distribución.
Así tenemos:
- Mediana: Toma el valor hasta el que se puede encontrar la mitad de las variables.
- Dispersión: Se utiliza la división por cuartiles donde a mayor dispersión, mayor será la distancia entre los mismos.
Diagrama de Box Y whiskers
Medidas de asociación
La medida de asociación nos permite ver la relación existente mediante dos variables utilizado el coeficiente de correlación.
Allí se usa la covarianza, donde se analizan las diferencias entre la media de ambas variables y nos permite ver la relación entre ellas.
Este indice de correlación tomará un valor entre -1 y 1, de forma que cuando toma los valores de las puntas están perfectamente correlacionadas de forma inversa o directa y si es 0 no tienen correlación alguna.