Clase 4: ppt Flashcards
Si los datos siguen una distribución normal, entonces…
La media es una adecuada medida de resumen
- De lo contrario tenemos que examinar bien los datos para ver si nos conviene representarlos con la mediana y usar técnicas no paramétricas de inferencia.
Distribución de gráfica que mas se parece a una distribución normal
- Mesocúrtica
- Tipos
- Platicúrtica
- Leptocúrtica
- Mesocúrtica
En la gráfica, con que tiene que ver el sesgo?
- Con las colas
- Sesgo a la izquierda: sesgo negativo
- Sesgo a la derecha: sesgo positivo
Coeficiente de variación y distribución normal
Si el coeficiente de variación es <50% significa que es cerca a la distribución normal
Las 2 pruebas de normalidad más conocidas a saber son (métodos más utilizados para probar la normalidad de los datos):
- Shapiro Wilk (n< 50)
- Kolmogorov Smirnov (n>50)
H0 en pruebas de normalidad
H0: tiene una distribución normal
¿Por qué nos interesaría la variabilidad de un grupo de datos?
- Dos poblaciones de datos podrían tener la misma media, sin embargo una puede tener más variabilidad que la otra.
- Además, muchas veces necesitamos saber si dos grupos de datos comparten similares varianzas.
¿Cómo comparamos las variabilidades?
- Mediante la varianza.
- Para comparar el tamaño relativo de dos varianzas, tomamos la razón entre ambas, ajustado por sus grados de libertad.
- El valor crítico tabulado del resultado, depende de los grados de libertad.
¿que se usa si quiero comparar una sola varianza teórica?
Test de chi-cuadrado
¿Qué se usa si deseo comparar 2 varianzas?
Utilizo la prueba F
son útiles al evaluar la validez del supuesto de igualdad de varianzas requerido para las pruebas “z” y “t”, así como también para el análisis de varianza (ANOVA).
Los tests de varianza
Hipótesis nula en test de varianza
- 𝐻_0: las varianzas son iguales.
- Por lo tanto, un test significativo rechaza a Ho.
- Es decir que lo que realmente necesitamos para probar nuestra igualdad de varianzas es que el test resulte no significativo.
¿que usamos en la variabilidad de dos muestras?
Test F
¿que es la distribución F?
Es el rango de valores que mi F puede tomar
¿Qué usamos para Para evaluar la igualdad de variabilidad de tres o más muestras.?
1.Usamos un test llamado: Test de homogeneidad de varianzas Barlett
2. Prueba de Levene
Para evaluar la igualdad de variabilidad de tres o más muestras.
¿cómo seria la hipótesis nula en este caso?
- 𝐻𝑜: σ1^2=σ_2^2=σ_3^2
En el análisis de variabilidad de 3 o más muestras
¿qué pasa si el test resulta no significativo?
¿y si es significativo?
- Significa que las varianzas de todos los grupos son iguales
- Significa que al menos una de las varianzas es distinta
Definición de Sesgo
Es cualquier proceso que tiende a producir resultados que difieren SISTEMÁTICAMENTE de la realidad (error sistemático).
¿Con que no confundir el sesgo?
Con el error aleatorio
La primera fuente de sesgos en los estudios descriptivos es la…
Ausencia de un grupo control
3 fuentes mayores de sesgo
- Sesgo de selección
- Sesgo de clasificación
- Sesgo de confusión
¿qué validez es cuestionable en sesgo de selección?
La validez externa (por ser una muestra no representativa)
¿cuándo un sesgo de selección es peor?
¿qué se afecta?
- Cuando el sesgo de selección es diferencial
- osea un grupo es diferente - Se afecta la validez interna
Disminuye el sesgo diferencial de selección
La aleatorización
Otro motivo aparte de sesgo de selección
Se puede producir al reritrarse sujetos de la investigación
De que resulta el sesgo de clasificación?
- Resulta de una inadecuada medición o registro
No existe herramienta de medición perfecta. Todos los estudios tienen algún grado de sesgo de medición
…
Si ocurre aleatoriamente…
No es diferencial
cómo se puede prevenir el sesgo de clasificación en ensayos clínicos?
Con cegamiento
otro nombre para sesgo de clasificacion
Medición o de información
es una asociación espuria entre un factor y un resultado.
Sesgo de confusión
Un confusor está relacionado al… y tiene…
Un confusor está relacionado al resultado y tiene distribución desigual entre grupos
aleatorización y sesgo de confusión
La aleatorización ayuda, pero a veces no elimina
¿donde es muy frecuente el sesgo de confusión?
en estudios observacionales
único sesgo que se puede controlar en el análisis
Sesgo de confusión