Estadística Flashcards
Variable cuantitativa discreta vs. contínua
- Contínua: glucemia
- Discreta: nº de episodios de asma
Variable cualitativa dicotómica, no dicotómica, ordinal
- Nominal-Dicotómica: sexo
- Nominal-No dicotómica: raza
- Ordinal: nivel socioeconómico, escala de glasgow
Uso de mediana en
Muestra no-homogénea, asimétrica, atípica
Medidas de centralización
Media, mediana, moda
Desviación media
suma de diferencias respecto a la media y división entre nº de individuos (valores absolutos, no negativos)
Varianza
suma de cuadrados de diferencias respecto a la media y división entre nº de individuos (no hace falta en valores absolutos, el cuadrado lo elimina)
Desviación típica o estandar
Raiz cuadrado de la varianza (±)
Rango o recorrido
Medida de dispersión que utiliza el 1º y último datos (los menos representativos)
Medida de centralización y dispersión: en distribución homogénea
- Medida de centralización: media
- Dispersión: desviación estandar
Medida de centralización y dispersión: en distribución asimétrica
- Medida de centralización: mediana
- Dispersión: rango intercuartílico
Coeficiente de variación
Relaciona la desviación típica con la muestra de la que procede (dividiendose con la media) para así poder compararla con otras variabilidades de otras muestras. Es adimensional
Dispersión concentrada vs. dispersión excesiva
En muestras biológicas:
- D. cocentrada: si la desviación típica no excede el 1/3 de la media
- D. excesiva: si la desviación típica es mayor que la mitad de la media
Distribución normal: entre ±1 desviación estandar %?, entre ±2 %?, entre 1 y 2 %?
- 1: 68%
- 2: 95%
- 1 y 2: 27% (95-68)
En una distribución normal, qué % es mayor que la moda?
50%
Percentil
Parámetro de posición que divide la muestra en 100 partes iguales. Ejemplo: percentil 80, 80kg
- El 80% de las observaciones tendrá 80kg o menos (incluye)
- El 20% tendrá más de 80 kg
Equivalencia a percentil 50
Mediana
Por qué se usa la mediana en muestras heterogéneas/sesgada/asimétrica
Por que elimina los valores extremos
Parámetros que definen una muestra
Tamaño, medida de tendencia central y dispersión
La probabilidad de error se expresa cuando
Hablamos de población y no de muestra (conocemos a todos los individuos de la muestra)
Calcular intervalo de confianza (IC)
A partir de la media, desviación típica y nº individuos de la muestra:
- IC 95% (p<0,01) = X ±3 (DS/√n-1)
- en realidad es 2,57
Calcular intervalo muestral del 95% partiendo de media muestral e IC poblacional
Intervalo muestral 95% (cuánta gente de la muestra está en el 95% central): X ±2 (xDS)
- X lo tenemos de la muestra; **DS se saca a partir de la fórmula de IC poblacional:
- IC 95% (p<0,05) = X ±2 (DS/√n-1)
ej: 196-204 = 200 ± (DS/√n-1); para seguir elegiremos los límites superiores [204=200+2 (DS/√n-1)] o inferiores [196=200-2(DS/√n-1)]
=DS=20
Intervalo 95% muestra: X±2(xDS), 200±40
La precisión de la inferencia estadística depende de
El tamaño muestral
Error estandar de la media; fórmula y qué pasa si aumentamos muestra 4 veces?
EEM=DS/√n
-EEM se reduce a la mitad (sólo se puede inferir con nº, el DS depende de la variable)
Si un intervalo de confianza es demasiado amplio y queremos ganar precisión (reducirlo)
Ampliaremos tamaño muestral