Estadística inferencial Flashcards
Qué permite la estadística inferencial?
- Excluir que el azar explique los hallazgos clínicos (de la investigación)
- Establecer si existe o no alguna diferencia entre los grupos comparados
Por qué razón es imposible tener el 100% de certeza en una investigación?
- Porque se trabaja con muestras, no el universo completo
Qué elementos permiten determinar la prueba de diferencia estadística a utilizar?
- El tipo de variable
- Características de la variable: si es cuantitativa, generalmente su distribución
Característica del universo
- Inabarcable
- Imposible
- Sin límite de tiempo ni espacio
De qué forma se describe la muestra del estudio?
- Mediante:
> estadísticos
> estadígrafos
> Estimadores
- Ejemplos: > Promedio > Mediana > Moda > DS > Frecuencia relativa > Varianza
De qué forma se pueden extrapolar los hallazgos obtenidos en una muestra al universo completo?
- mediante el proceso inferencial:
> Estimaciones por intervalo de confianza
> Pruebas de Inferencia estadística
De qué forma funcionan las pruebas de estadística inferencial?
Mediante pruebas de contraste de hipótesis:
- Poner a pelear 2 ideas mutuamente excluyentes:
> H0 = hipótesis nula
> H1 = hipótesis alterna
Definición de H0 o Hipótesis nula
- Asume que no hay diferencia entre los grupos comparados
- Cualquier diferencia es solo atribuible al azar
*Conocimiento médico a la fecha
Definición de H1 o hipótesis alterna
- Asume que hay diferencia entre los grupos comparados
- Dicha diferencia entre los grupos no es atribuible al azar
Qué es el estadístico de prueba?
- Expresión matemática de lo que que se está preguntando en la investigación
Para qué se realiza la prueba de contraste de hipótesis y el estadístico de prueba?
- Para escoger entre H0 y H1
- La prueba estadística toma los datos descriptivos entregados y los estandariza en un estadístico de prueba
Qué se realiza con el valor del estadístico de prueba?
- Se evalúa cuántas veces ocurre en la vida común y corriente
- Si el estadístico de prueba toma un valor muy extremo = RARO
Qué se considera como raro en relación a los valores del estadístico de prueba?
- Todo aquello que ocurre menos del 5% de las veces
- Es estadísticamente significativo
Qué asume algo estadísticamente significativo? (que ocurre menos del 5% de las veces)
- Que la hipótesis nula es falsa y la alterna es correcta
Qué información da el estadístico inferencial? qué rol cumple el investigador?
- Estadístico inferencial = indica que el azar no fue, o que probablemente no fue
- Investigador = su tarea es decir el porqué de la diferencia de los grupos
Qué es el valor alfa?
- Valor corte que permite decidir entre asumir la hipótesis nula o la alterna
- Establecido internacionalmente por convención
- Valor de corte de probabilidad de cometer error aleatorio (tipo 1)
Qué valor alfa se debe tener si es que se quiere publicar la investigación?
- 5% o menos (estadísticamente significativo)
Qué es el error tipo 1 o aleatorio?
- Rechazar la hipótesis nula cuando era verdadera
Qué es el P value?
- Probabilidad de observar un estadístico de prueba tan extremo como el de la muestra considerando que la H0 es cierta
- Probabilidad de que lo observado/la asociación, sea explicada por el azar
De qué depende la selección de la prueba estadística ideal ?
- Del escenario
2. - Del área de conocimiento
Elementos necesarios para la elección de la prueba estadística ideal
1.- Tipo de variable (cuantitativa/cualitativa)
2.- En caso de cuantitativa:
> Distribución
> Varianza
Características de distribución normal de datos
- Medidas de tendencia central son iguales (media, mediana y moda)
- Simétrica, forma de campana
- Varianzas homocedásticas
- Entre -1 y +1 está el 67,5% de datos
- Entre -2 y +2 está el 95% de datos
- Entre -3 y +3 está el 99% de los datos
Para qué se utiliza la distribución gaussiana?
- Para describir aquello que es normal y lo anormal en medicina
Cuál es la primera forma de certificar que una distribución es normal?
- Verificar si las reglas de distribución normal se cumplen
Cuál es la mejor forma de determinar que una distribución es normal?
- Graficándola: histograma de frecuencias
> Curva normal característica
De qué otra forma se puede determinar que una distribución es normal?
Aplicación de pruebas estadísticas específicas:
- Prueba de Kolmogorov-Smirnov (KS)
- Prueba de Shapiro-Wilk
- Prueba d’Agostino
Qué desventaja tienen las pruebas que se utilizan para determinar la distribución normal de los datos?
- Alta tasa de falsos positivos y falsos negativos
Cómo funcionan las pruebas específicas para determinar la distribución normal de datos?
Hacen prueba de hipótesis: contrastan 2 ideas mutuamente excluyentes
- H0 la distribución de los datos NO difiere de una normal (ES NORMAL)
- H1 la distribución de los datos SÍ difiere de una normal (NO es normal)
- Un p value significativo (menor a 5%) indica que la probabilidad de que la distribución de los datos sea normal, ES MUY BAJA, por lo tanto, NO se asume como NORMAL
Qué desventaja tienen las pruebas estadísticas para datos que no siguen distribución normal=
- En general poseen menor poder estadístico, les cuesta encontrar significancia
De qué otra forma se puede comprobar la distribución normal de los datos?
- Teorema central del límite: a cierto tamaño muestral, cualquier estadístico de prueba utilizado de la muestra adoptará una distribución normal
- En la práctica se asume distribución normal al tener la muestra necesaria
Qué datos, independiente de sus propiedades y forma en que se obtienen, nunca adoptarán una distribución normal con ningún tamaño de la muestra?
- El tiempo
- Tiene sólo valores positivos
- No hay puntos negativos en las curvas de tiempo
- Ninguna prueba de supervivencia asume normalidad (ocupa tiempo)
Qué tamaño muestral nos permite asumir normalidad?
- 30 por grupo
Si no se tiene el tamaño muestral suficiente por grupo para asumir normalidad, qué se realiza?
- Demostrar normalidad mediante histograma de frecuencias
- Asumir NO-normalidad y ocupar pruebas adecuadas
Selección de prueba ideal: Variable cualitativa con cualitativa
- Prueba exacta de Fischer (entrega p value)
2. - Chi cuadrado
Selección de prueba ideal: Variable cualitativa con cuantitativa
- Si la distribución es normal:
> T de student para muestra pareada
> T de student para muestra NO-pareada - Si la distribución NO es normal:
> Wilcoxon para muestras pareadas
> Mann-Whitney para muestras NO-pareada
Selección de prueba ideal: Variable cualitativa con cuantitativa cuando hay más de 2 grupos
- Ver distribución:
> Normal: ANOVA (análisis de varianza)
> No-normal: Krukall-Wallis
En qué casos se utilizan las pruebas ANOVA y Kruskall-Wallis?
- Cuando hay más de 2 grupos en comparación
- Para evitar el desgaste de P
- Dicen si hay al menos 1 de las diferencias entre los grupos que sea significativa (no especifica cuál)
Qué se puede hacer en caso de querer saber cuál es la diferencia específica estadísticamente significativa en ANOVA y Kruskall-Wallis?
- Corrección de Bonferroni:
> Dividir el p value por el número de comparaciones que se harán
Selección de prueba ideal: Variable cuantitativa con cuantitativa
- Distribución:
> Normal = Correlación de Pearson
> No-normal = Correlación de Kendall (variables cualitativas ordinales)
Qué información entregan las pruebas de correlación de Pearson y Kendall?
- P value
- Medida de fuerza de asociación:
> Valor de -1 a +1
> Entre -1 y 0 = relación inversa entre variables
> Entre 0 y +1 = relación directa entre las variables
*No permiten predecir comportamiento de una variable en función de la otra
Qué se puede realizar si es que se desea saber el comportamiento de una variable en función de la otra? (cuantitativa con cuantitativa)
- Técnica de regresión lineal
Qué es el error aleatorio ?
- Error inherente a trabajar con muestras
- Se disminuye aumentando la muestra (no se puede corregir completamente)
Error tipo 1, alfa
- Rechazar la H0 cuando es verdadera
- Considerar algo significativo cuando NO lo es
- Valor crítico de ocurrencia alfa = 5%
Error tipo 2, beta
- NO rechazar la H0 cuando es falsa
- Considerar algo como NO significativo cuando SÍ lo es
- Valor crítico de probabilidad de ocurrencia = 20%
Qué es la potencia estadística?
- Probabilidad de rechazar la H0 cuando es falsa
> Probabilidad de que el estudio encuentre lo que espera ver - Valor mínimo aceptable de 80%
Qué es el sesgo?
- Error sistemático
- Por defectos en el diseño del estudio, que pueden invalidarlo:
> Predecibles
> Corregibles
> Controlables