Comparación de medias Flashcards
Utilidad de comparación de medias
Saber si se es capaz de excluir el rol del azar en explicar los hallazgos, lo que llamamos significancia estadística, la cual se distancia de lo clínicamente relevante
Estadístico de prueba
- Los datos recolectados no se analizan directamente sino que se estandarizan y convierten en un estadístico de prueba.
- Tiene una distribución conocida, sabemos su comportamiento en cualquier escenario y nos permite estimar el P Value
Definición de p value
- Probabilidad de tener un estadístico de prueba tan extremo como el de la muestra, asumiendo que la hipótesis nula (que no hay diferencia entre los grupos comparados) es verdad.
- Se usa para estimar si algo es estadísticamente significativo.
- Es una probabilidad del 0 al 1.
Otra definición de p Value
cuál es la probabilidad de encontrar diferencias entre grupos asumiendo que los 2 NO están asociados
Lo que asumimos NO atribuible por el azar son las cosas:
- MUY raras
- La única manera de estar 100% de que lo observado no se atribuye al azar es trabajar con TODA la población o trabajar con un universo
Contraste de hipótesis
pones a pelear dos ideas que son excluyentes y ocupas el p value para escoger con que idea te vas a quedar
La hipótesis nula H0
- no hay diferencias entre los grupos comparados o las diferencias que yo encontré son totalmente explicables por el aza
La hipótesis alternativa H1 o Ha es que
las diferencias encontradas no son explicables por el azar
Nivel de significancia estadística
- El umbral cuando yo digo que algo es muy raro
- Por convención se asume como 5% = alfa de 0,05 = cualquier cosa que ocurra menos del 5% de las veces yo la voy a asumir como muy rara
- Vamos a pensar que nuestra hipótesis nula es mentira y preferimos quedarnos con la alterna (que las diferencia encontradas no se explican por azar) y a eso lo llamamos estadísticamente significativo
La hipótesis nula es
estrictamente lo que esté aceptado por el conocimiento actual a la fecha en que realices tu estudio
La única manera de estar 100% seguros es
trabajar con el universo, que es imposible
P value es muy dependiente de
del tamaño muestral
El estadista de datos es paladín de la H0, se asume siempre como correcta, tu tienes que juntar muchísima evidencia, algo que sea muy raro de ver para asumir que la nulidad es falsa y este concepto se traduce en
nunca se habla de que se acepta la H1, siempre se habla de si aceptas o rechazas la H0
Cada vez que sacas una muesta existe
incertidumbre de que esta represente realmente a la población
Error estándar: .
La media muestral es solamente una apuesta respecto a una media poblacional, pero como todo estimador está expuesto a incertidumbre y posibilidad de error
El error estándar depende de
Tamaño de la muestra que se está tomando
La desviación estándar
Cuánto cambia un valor cualquiera a partir del promedio, en relación al tamaño de la muestra
Lo que hace la T de student es
- Considerar la magnitud de una diferencia (de un cambio) que estás viendo, en relación a cuánta incertidumbre existe a partir de esa medición.
- Cuantificar la magnitud de una diferencia contra la incertidumbre respecto a que se cambie la diferencia, entonces matemáticamente es un contraste una división
La t de student asume una serie de cosas para ser válido
- Los cambios que son pequeños son comunes
- Los que son grandes son muy raros
La T de student
- Ofrece una estandarización de cualquier dato cuantitativo a analizar.
- Los valores que se toman siguen una distribución que es conocida: llamada t de student
- Podemos saber cuántas veces t de student va a tomar un valor determinado dadas ciertas condiciones: p value
Cuando el tamaño de la muestra es grande y es matemáticamente importante, el n es
- > 20
- Pero en medicina se trabaja con n >30, la distribución de T es idéntica distribución normal
Antiguamente esa T=1.25 se llevaba a una tablita, considerando 2 cosas:
- Tamaño muestral, el que otorga grados de libertad (tamaño muestral -1)
- Nivel de significancia (por defecto es 5%)
El 1 o 2 colas es la traducción matemática de siguiente idea:
La pregunta que se hace en investigación, habitualmente es neutral: por ejemplo, si existen o no diferencias entre 2 grupos, pudiendo ser las diferencias en 2 sentidos (un grupo mayor, otro menor y viceversa)
La magnitud de la diferencia entonces sería el resultado de la media muestral menos la media ya conocida.
En relación a cuanta incertidumbre existe a partir de la media que sería el error de esa media, este se calcula dividiendo desviación estándar por la raíz cuadrada del tamaño de la muestra
T= x1 -x2 / S/raízcuadradaN
S: desviación estándar
x= media
N= muestra
Reglas para ocupar T de student
- La distribución debe ser normal (n>20, en medicina n>30)
- Las muestras son INDEPENDIENTES
- Homocedasticidad de Varianzas (varianzas iguales, con desviaciones estándar parecidas)
- Que hayan pocos, o no hayan outliners (valores extremos)
- Muestra aleatoria (representativa de la población)
En la práctica el punto más importante para ocupar T de student es el:
es el 1, que el tamaño muestral sea mayor a 30, porque el T student es tan robusto que si no se cumple alguna de las 4 siguientes igual podemos asumir una distribución normal para el estadístico T