Contraste De Hipotesis Flashcards
Para la comprensión de este concepto sobre la hipótesis nula, hipótesis alternativa y grado de significación estadística, haremos un ejemplo
Para la comprensión de este concepto, se partirá de un caso práctico.
1- Se compara un tratamiento nuevo (N) contra la hipertensión arterial con uno tradicional (T) en 2 series de individuos. Tras cierto tiempo, N controla al 70% de los individuos y T al 30%.
• El problema consiste en saber si este hecho es debido una mayor eficacia real de N o lo es simplemente por diferencias que la azar puede establecer (variaciones aleatorias del muestreo), sin que existan diferencias reales en el control de hipertensos entre ambos tratamientos.
2- Para abordar este problema, se consideran dos hipótesis:
- Hipótesis nula o H0: no existe diferencias entre los dos tratamientos (N = T).
- Hipótesis alternativa o H1: si existen diferencias entre los dos tratamientos (N no es = a T).
3- Estas dos hipótesis son mutuamente excluyentes, de forma que sólo hay dos decisiones posibles:
- Rechazar H0: es igual a aceptar H1.
- No rechazar H0 es igual a no poder aceptar H1.
Cuál es la probabilidad máxima de que los resultados diferentes observados entre los dos grupos mencionados en el ejemplo pueden ser repito simplemente a lazar es decir H0 cierta
1- Previamente al ensayo de una hipótesis, se fija la probabilidad máxima de que los resultados diferentes observados entre los dos grupos pueden ser debidos simplemente a lazar (H0 cierta), que suele ser por convenio del 5%.
2- A continuación, se calcula cuál es la probabilidad de que las diferencias que se han observado pueden ser explicadas por el azar:
• Esta probabilidad es el valor de la p o “grado de significación estadística”. Así, cuanto menor sea p, esto es, cuanto mas baja sea la probabilidad de que el azar sea el responsable de las diferencias, mayor será la evidencia contra H0 y a favor de H1.
Teniendo en cuenta el grado de significación estadística, como interpretamos
1- p < a 0,05: diferencias reales.
- Existe poca probabilidad de qué se deban al azar.
- Se acepta H1.
- El resultado es estadísticamente significativo.
- Se rechaza H0.
2- p > 0,05: no existe suficiente evidencia como para decir que ambos tratamientos son distintos.
- Las diferencias pueden deberse al azar, con una probabilidad mayor a nivel de exigencia.
- No se rechaza H0.
Entonces, el valor de P es
1- El valor de P es, por tanto, la probabilidad de observar los resultados de un estudio (u otros más alejados de H0), si la H0 fuese cierta.
2- Es muy habitual caer en el error de considerar que la p es la probabilidad de qué H0 sea cierta. Se parte de la hipótesis de qué H0 es cierta para poder calcular después el valor de la p. Por ejemplo: si se tiene un estudio en el que la p es 0,03, no se podrá decir nunca que hay una probabilidad del 3% de que los dos grupos sean iguales.
Cuál es la característica que más influye en el cálculo de los valores de la P
La característica que más influye en el cálculo de los valores de la p es el tamaño de la muestra:
- Con muestras de pequeño tamaño (n < 30), es muy probable que aparezcan valores de p no significativos.
- Sin embargo con tamaños muestrales muy grandes es frecuente encontrar diferencias por pequeñas que estás sean.
Cuantos tipos de errores tenemos en el contraste de hipótesis
- Error tipo I o alfa.
- Error tipo II o beta.
Qué es el error tipo I o alfa
1- El error tipo I: situación en la que se rechaza H0 siendo cierta, es decir se acepta que hay diferencias y, de hecho, no las hay.
- Es como un falso positivo: dar como significativo algo que no lo es.
- Se denomina alfa a la probabilidad de cometer el error tipo I.
- El valor de P coincide con la probabilidad de cometer el error tipo I es decir, coincide con el valor de alfa.
2- Cuando entre los distintos grupos de estudio se compara más de una variable de resultado, aumenta la posibilidad de resultados falsamente positivos. Para evitarlo, se incrementa la exigencia del nivel de significación.
Como aumentó el nivel de significación y cuando lo hago?
1- Cuando entre dos distintos grupos de estudio se compara más de una variable de resultado, aumenta la posibilidad de resultados falsamente positivos.
2- Para evitarlo, se incrementa la exigencia del nivel de significación como sigue:
• p= 0,05/ n. número de comparaciones.
Es el error tipo II
El error tipo II es la situación en donde no se rechaza H0 y esta es falsa, es decir no se aceptan las diferencias y si las hay.
- Sería como un falso negativo: se da como no significado algo que lo es.
- Se denomina beta a la probabilidad de cometer un error tipo II.
Qué es poder o potencia del Test
1- Lo complementario del error beta es la “potencia o poder estadístico de un Test” (1 - β).
2- Se define como la capacidad que tiene un Test de detectar una diferencia cuando ésta existe en realidad, es decir, corresponde a la probabilidad que se tiene de demostrar la hipótesis alternativa, siento cierta.
Para el contraste de hipótesis vamos a jugar con una tabla de contingencia
1- Vamos a tener una columna que indica lo que realmente es, que se dividirá en dos columnas:
- A la izquierda: Existe realmente diferencias, H0 es falsa.
- A la derecha: No existe realmente diferencias, H0 es cierta.
2- Vamos a tener una fila que indica los resultados del Test, es lo que yo digo. Esta fila se divide a su vez en dos filas:
- Fila de arriba: yo digo que hay diferencias significativas. Rechazo H0.
- Fila de abajo: yo digo que no hay diferencias significativas, no rechazo H0.
3- Ahora correlacionaré conceptos y podré obtener cuatro resultados:
- Cuadrante inferior derecho: realmente no existe diferencias, es decir H0 es cierta y yo digo que no hay diferencias significativas y no rechazo a H0: esto es 1 - alfa.
- Cuadrante superior derecho: realmente no existe diferencia por lo tanto H0 es cierta y yo digo que hay diferencias significativas y por lo tanto rechazo H0: A esto se denomina error tipo I o error alfa.
- Cuadrante inferior izquierdo: realmente existe diferencias por lo tanto H0 es falsa y yo digo que no hay diferencias significativas y por lo tanto no rechazo H0: este es el error tipo II o error beta.
- Cuadrante superior izquierdo: realmente existe diferencias, por lo tanto H0 es falsa y yo digo que hay diferencias significativas y rechazo H0: esto es 1 - beta o el poder estadístico o potencial del test.
Para que es utiliza en las pruebas de significación estadística
1-Las pruebas de significación estadística o test de contraste de hipótesis pretenden demostrar o no la asociación estadística entre dos variables observadas en una muestra, generando un valor de p.
2- Obviamente, dependiendo del tipo de variables que se tenga que analizar, se debe utilizar un test de contraste de hipótesis u otro.
Qué son los datos apareados
1- En una única muestra se estudia si existe una diferencia significativa en la variable-resultado antes y después de algún acontecimiento relevante.
• Es decir son distintas observaciones sobre mismos individuos: por ejemplo medir la glucosa a 10 individuos por la mañana es la muestra A y medir glucosa de las 10 mismas personas en la tarde, es la muestra B.
2- Comprobar datos entre diferentes individuos por ejemplo ancianos versus jóvenes serán muestras no apareadas o independientes.
Qué pruebas de significación estadística utilizamos para los datos apareados
Tres posibilidades:
1- Si variable-resultado es cualitativa de 2 o más categorías: test de McNemar.
2- si variable-resultado es cuantitativa: t de student apareada.
3- si variable-resultado es cuantitativa (varias medidas): ANOVA para medidas repetidas.
Cuáles son los test no paramétricos
1- Son pruebas que no dependen de la distribución de la variable y no precisan condición previa de normalidad.
2- Estas pruebas no manejan los valores cuantitativos que toma la variable en cuestión, sino únicamente sus rasgos.
3- Son pruebas de menor precisión que las paramétricas, por lo que solamente demostrarán cómo significativas diferencias mayores.
4- Por lo tanto, generalmente se prefiere utilizar las pruebas paramétricas como T de student, análisis de varianza, etc.