Estadística descriptiva Flashcards
Valores resultantes de una recopilación presentados como una masa de datos desorganizados
Datos crudos o no agrupados
Lista de valores de un grupo (población o muestra) en orden de magnitud de menor a mayor
Arreglo ordenado
Agrupación de datos en categorías mutuamente excluyentes; indican el número de observaciones en cada categoría
Distribución de frecuencias
¿Cuándo son útiles las tablas de distribución de frecuencias?
Cuando no son excesivamente complejas
Función de las tablas de distribución de frecuencias
Representar variables
¿Cómo se realiza una distribución de frecuencias de datos cuantitativos?
- Se dividen los rangos en intervalos que no se traslapen
- Se eligen los valores superiores e inferiores
- De cada intervalo se cuenta el número de observaciones cuyos valores caen dentro de cada par de límites
- Los resultados se acomodan en forma de tabla
¿Cómo se realiza una distribución de frecuencias para variables cualitativas (nominales y ordinales)?
Conjunto de clases o categorías con cantidades numéricas correspondientes a cada una
Número de veces que aparece determinado valor en un estudio estadístico
Frecuencia absoluta
Cociente entre la frecuencia absoluta de una determinada clase y el número total de datos; proporción del número total de observaciones que aparece en un intervalo
Frecuencia relativa
La suma de las frecuencias relativas debe ser igual a
1
Porcentaje
Frecuencia relativa x 100
Total acumulado de todas las frecuencias hasta el punto actual del conjunto de datos; frecuencia absoluta actual + frecuencia absoluta anterior
Frecuencia acumulada
Cociente entre la frecuencia acumulada de un determinado valor y el número total de datos
Frecuencia relativa acumulada
Intervalos continuos que no se translapan; cada valor del conjunto puede ser puesto en solo uno de los intervalos (mutuamente excluyentes)
Intervalos de clase
Cantidad de intervalos de clase sugeridos
De 6-15
Relación que se usa para calcular un número de clases adecuado para una muestra (n)
Relación de STURGES (hay que redondear el valor)
Primer paso para realizar una tabla de distribución de frecuencias
Calcular el rango = Dato mayor - dato menor
Posterior al rango se calcula la amplitud de intervalo, la cual es
División del rango entre el número de clases
Diagrama que permite resaltar diferencias cuantitativas entre los diferentes valores de la variable cualitativa.
Diagrama de barras
Proporción o porcentaje en que las diferentes características ocurren en comparación con el total; para ser fácilmente legible debe incluir máximo 5 categorías
Diagrama de pastel
Gráficas para variables cuantitativas
Histograma
Polígono de frecuencias
Gráfica de líneas
Diagrama de caja
Representación gráfica de una variable en forma de barras adyacentes; la superficie de cada barra es proporcional a la frecuencia de los valores representados
Histograma
Características del histograma
El eje vertical debe comenzar en cero.
Alternativamente puede mostrar debajo de cada barra el intervalo o la marca de clase.
Clase especial de gráfica lineal en la que se debe localizar el punto medio (marca de clase) de cada intervalo. El polígono cae sobre el eje horizontal en ambos extremos
Polígono de frecuencias
Marca de clase
(Límite superior + Límite inferior)/2
Muestra una serie como conjunto de puntos conectados mediante una sola línea. Sirven para representar grandes cantidades de datos que tienen lugar durante un período de tiempo continuo. Ej. temperatura
Gráfica de líneas
Revela información respecto a la magnitud de la dispersión, localización de la concentración y simetría de los datos. Para construirla se usan los cuartiles del conjunto de datos.
Diagrama de caja o bigotes
Características de las distribuciones de variables cualitativas a describir
- Forma
- Centro
- Dispersión
- Valores atípicos
Datos a considerar en la forma
Simetría o asimetría de la distribución
Picos o modas de la distribución
Distribución sesgadas a la derecha
Distribuciones sesgadas a la izquierda
Distribuciones sesgadas a la derecha
La cola derecha (Valores más grandes) es mucho más larga que la cola izquierda (valores pequeños)
Distribuciones sesgadas a la izquierda
La cola izquierda (Valores más pequeños) es mucho más larga que la cola derecha (valores más grandes)
Se usa a menudo para representar un valor típico
Centro
Cómo se define el centro
Se usa la mediana o el valor promedio (pero no las dos)
Dispersión (variabilidad o variación)
Rango aproximado cubierto por los datos, al mirar el histograma se puede aproximar el mínimo y el máximo
Valores atípicos
Aquellos que sobresalen de la distribución