Estadística descriptiva cap2 Flashcards
muestra
subconjunto de datos extraídos o registrados de la población en un momento determinado
se escoge aleatoriamente
cada muestra da un resultado distinto (objeto cambiante)
por qué la muestra se escoge aleatoriamente
para evitar sesgos y mayor representatividad
que indican las medidas probabilisticas
indican calidad de evidencia
se tiene en cuanta la incertidumbre
estadística descriptiva
resume info registrada mediante medidas de resumen (antes de medidas probabilísticas)
que muestra la estadística descripitiva
como se comporta o distribuye la indo de las variables recolectadas y como se relacionan
distribución
frecuencia de valores de una variable en la muestra
pueden no estar todos los valores posibles
objetivo de la estadística descriptiva
resumir la info contenida en un conjunto de datos sin perder aspectos relevantes para las inferencias inductivas (que son en base al resumen)
en qué enfocar las variables
en resumen de distribución
parámetros poblacionales de interés
variables cualitativas
mas intuitiva para resumir info
contar ocurrencia de cada categoría
que es la frecuencia absoluta
la ocurrencia de cada categoría
cuando usar frecuencia relativa y %equivalente
a veces f absoluta no relevante: no permite dimensionar tamaño respecto al de la población o valor de referencia
frec relativa
frec absoluta/total de eventos
(valores de 0-1. x100 si quiero %)
como se llama la frec relativa en bioestadistica
proporciones
para que sirven las frecuencias
analizar distribución de info. en distintas categorías
para que sirven los indicadores y medidas de resumen
para caracterizar la variable (+ fácil de comparar)
que medida de resumen ocupar en variables cualitativas
moda
que es la moda
categoría con mas frecuencia. Puede haber + de 1
para que sirven las frecuencias
estimar indicadores de salud (prevalencias, incidencias, tasas, etc)
gráficos para variables cualitativas
barra o torta (frec absoluta o relativa)
para que sirven los gráficos
observar distribución de variable
relación entre 2 o mas variables
deben ser autoexplicativos y tener referencias a variables y categorías (frec. absoluta o relativa)
variables cuantitativas
dividir rango de valores en intervalos (tabla de frecuencias)
para que sirve una tabla de frec
categorizar variable cuantitativa
(transformar en variable cualitativa ordinal)
nr de intervalos
info suficiente en cada uno para ver comportamiento o distirbución
que se puede sacar en variable cuantitativa (frec)
frecuencia absoluta y acumulada (info sumada a medida que crece variable)
v cuantitativa sigue un orden y jerarquía
medidas de reusmen para variables cuantitativas
media
percentiles
mediana
promedio/media
valor mas cerca de posibles valores de variable
valor representativo de distribución
suma de datos/total
no es representativo si los datos están muy dispersos
no usar en
media ponderada, geometrica y armonica
percentiles
cuartiles
ptos de corte para intervalos - cada celda con misma cantidad de datosm
mediana
2do cuartil
no afectada por observaciones externas - depende del orden de la variable, no de valores
sirve en distr. asimetricas
calculo rápido y fácil de interpretar
medidas de tendencia central
moda, Md y media
usar para valores asimetricos y unimodales
md, media y moda
aprox iguales
distribución simétrica pero bimodal
Md y media iguales
distribución asimétrica pero unimodal
Md
como se mide la variabilidad de los datos
que tan lejos están uno de otro: DISPERSIÓN
varianza
desviación estándar
coef de variación
miden que tan lejos están los datos de la media
varianza
promedio de diferencias cuadraticas c/r a la media
cuando hay diferencias cuadráticas, usar
DE
u de medida no es igual con la que se midió la variable
coef. de variación
DE/media
variabilidad menor o mayor
gráficos para variables cuantitativas
histograma: frec absoluta y relativas
boxplot: cuartiles, valores atípicps
2 variables cualitativas
nr acotado de dist categorías
tabla de doble entrada con frec de categorías
var cualitativa con cuantitativa
medidas de tendencia central, posición o dispersión
boxplot
2 variables cuantitativas
scanner plot: grafico de dispersión
tendencia o relación entre variables