Clase 6 Flashcards
¿Qué es ANOVA de un factor?
Es una técnica estadística que se utiliza para
comparar la media de tres o más grupos y determinar si existen diferencias
significativas entre ellas.
en que nos ayuda ANOVA?
ANOVA ayuda a saber si hay una diferencia significativa en la media entre los
grupos que estás comparando o si cualquier diferencia que hayas observado se
debe simplemente al azar
¿qué mide el ANOVA de un factor?
El ANOVA de un factor mide los efectos medibles de las variaciones o diferentes
niveles de UNA ÚNICA VARIABLE INDEPENDIENTE sobre una VARIABLE
DEPENDIENTE.
¿cuáles son las limitaciones del ANOVA?
➢ Útil para investigar un solo factor y una sola variable dependiente.
➢ ANOVA puede demostrar estadísticamente que hay diferencias en por lo menos
una de las medias de tres o más grupos, pero no puede indicar qué par.
➢ Requiere que la variable dependiente esté distribuida de manera normal.
PRESUPUESTOS O REQUISITOS DE ANOVA
➢ Aleatoriedad de las muestras
Aleatoriedad significa que los elementos o unidades experimentales
son asignados de manera aleatoria .
➢ Independencia de las variables
Se refiere a que los resultados observados en un grupo (o tratamiento) no interfieren
en los resultados de otro grupo. El tamaño total de la muestra de cada grupo debe ser
< 10% de la población total a la que representa.
➢ Normalidad de las distribuciones (Prueba de normalidad de Shapiro-Wilk)
La variable de interés se distribuye conforme el modelo Normal en cada
grupo o tratamiento. Si la falta de Normalidad no es muy extrema puede mantenerse
como normal; si es extrema utilizar la Prueba No Paramétrica H de Kruskal-Wallis.
➢ Homocedasticidad de las varianzas (Prueba de Levine)
Las varianzas de los grupos son semejantes, es decir, la amplitud de la Campana de
Gauss es semejante, como se observa:
¿Qué otros supuestos tiene el test ANOVA?
- La variable dependiente o respuesta debe ser continua (si es de intervalo, mejor).
- La variable independiente o explicativa.
Debe estar formada por tres o más grupos categóricos e independientes. - Evitar tener valores atípicos (outliers) influyentes.
¿Qué sucede si mis datos no cumplen estos supuestos?
¿cuáles son las alternativas?
- El ANOVA de una vía se considera una prueba robusta frente a la
falta de normalidad, sin exceso; que la Campana de Gauss no sea
plana. - Dos alternativas:
(1)Transformar los datos para que la forma de la distribución sea normal
(2)Elegir una prueba no paramétrica que no supone normalidad.
¿qué hacemos si no existe homogeneidad de variantes?
Podemos aplicar el ANOVA de Welch y una prueba de Games-Howell en
lugar de una prueba post hoc de Tukey. Otra alternativa es aplicar una
prueba no paramétrica
Es el incumplimiento más grave en ANOVA
¿cómo lo arreglo?
- La falta de independencia de los casos es la más grave
- Deberíamos
pensar en otro tipo de prueba para hacer frente a este problema, por ejemplo
un diseño de medidas repetidas
¿Por qué hablamos de “una vía”? Y ¿Qué son los grupos o
niveles?
- Una vía significa que tenemos una única variable explicativa o predictor, también
llamada variable independiente. Esta variable debe tener tres o más niveles o
categorías.Por ejemplo, si queremos analizar el pH de distintas muestras de
jabón de bebé, la marca del jabón es nuestra variable independiente cuyos
niveles podrían ser Baño Dulces Sueños de Johnson’s Baby, Champú-Gel de
Weleda, Gel Champú de Suavinex y Babygel de Mustela Beb.
Hipótesis nula y alterna de ANOVA
- El ANOVA de un factor es un método estadístico de Prueba de
Hipótesis:
(H0) de que tres o más medias poblacionales son iguales frente a la
hipótesis alternativa.
(Ha) de que al menos una de las medias es diferente. Usando la
notación formal de las hipótesis estadísticas con k medias,
escribiríamos:
Ho: µ1= µ2= µ3= µ4=……µk
Ha: No todas las medias son iguales o (Ha: µi ≠ µj para algún i ≠ j)
Para qué se usa el Análisis de la Varianza (ANOVA)
1.Comparación de medias: El ANOVA se utiliza para comparar la media de tres o más
grupos y determinar si existen diferencias significativas entre ellas.
¿que son variables de escala?
- Cuando el 0 tiene un valor: temperatura por ejemplo
Se puede trabajar con ANOVA a pesar que la muestra no sea totalmente de distribución normal
Si ya sale de lo normal (extremos)
- Nos vamos por una prueba no paramétrica
¿cuál es el problema de ANOVA?
- Te dice que una media sale de lo común pero no te dice cuál
- Para eso usamos el test de Tukey
- Y si aún no se puede ver que media es usamos una prueba no paramétrica: Kruskal Wallis