Clase 4 - Semana 4 Flashcards
a qué puede deberse el error aleatorio
a la fluctuación o variación natural y periódica en la exactitud o precisión de prácticamente cualquier técnica de muestreo de datos o herramienta o escala de medición de salud
En un estudio de inv. clínica, el error aleatorio puede deberse a…
no sólo a la variabilidad humana innata sino también al puro azar
el error sistemático en un experimento surge…
surge de un defecto innato en la técnica de muestreo de datos o en el instrumento de medición.
- En el ámbito de la investigación clínica, el error sistemático se denomina
sesgo sistemático
Tipos mas comunes de sesgo en la investigación sobre anestesia, perioperatorios, cuidados intensivos y analgésicos incluyen los siguientes sesgos:
intensivos y analgésicos incluyen los siguientes sesgos:
- Sesgo de recuerdo
- Sesgo de observación (efecto Hawthorne)
- Sesgo de deserción
- Sesgo de clasificación errónea o informativo
- Sesgo de selección
La confusión no suele ser …
un problema en un ensayo aleatorio porque los grupos aleatorios están suficientemente equilibrados en todas las posibles variables de confusión, tanto observadas como no observadas.
en que tipo de estudio la confusión sí puede ser un problema
Estudio observacional (no aleatorio)
La probabilidad de que un error aleatorio distorsione las mediciones del estudio de manera positiva o negativa es
igual
dame un ejemplo de error aleatorio
Ejemplo: Esfigmomanómetro manual convencional informa que la presión arterial sistólica es ±20 mm Hg, de un momento a otro, debido a la respiración, las emociones, el ejercicio, las comidas, el consumo de tabaco o alcohol, la temperatura corporal, la distensión de la vejiga, el dolor y el ritmo circadiano.
no es más que una variabilidad en los datos de la muestra que no se puede explicar fácilmente
error aleatorio
el error aleatorio se puede…
Estimar matemáticamente y ajustar estadísticamente
surge de un defecto innato en la técnica de muestreo de datos o en el instrumento de medición
error sistemático
es una variación no aleatoria que distorsiona los hallazgos del estudio en una dirección.
error sistemático
el error sistemático es una v…
Variación no aleatoria que distorsiona los hallazgos del estudio en una dirección
ejemplo de error sistemático
Ejemplo: Esfigmomanómetro manual convencional informa consistentemente que la presión arterial sistólica es 10 a 20 mm Hg mayor que su valor real cuando se utiliza un tamaño de manguito demasiado pequeño en relación con la circunferencia del brazo del paciente
A medida que aumenta el tamaño de la muestra del estudio, el efecto del error aleatorio…
¿que sucede con el sesgo sistemático?
- Disminuye
- El error o sesgo sistemático generalmente no cambia con un tamaño de muestra creciente
¿Cuándo ocurre un sesgo de recuerdo?
El sesgo de recuerdo ocurre cuando un grupo o subgrupo de estudio tiene un recuerdo diferencial de exposiciones o eventos anteriores al inicio de una enfermedad.
cuándo es preocupante un sesgo de recuerdo?
En un estudio retrospectivo de casos y controles
¿cómo disminuyo el sesgo de recuerdo?
- Cegar a los recolectores de datos al estado de caso o control
- Recolectores de datos bien capacitados
- Recopilación de datos tiene que tener las mismas ayudas para la memoria
¿el sesgo del recuerdo es exclusivo de casos y controles?
NO
El sesgo de observación generalmente se considera menos probable en un
En un estudio aleatorizado cuando se observan ambos grupos
- Se dice que el efecto Hawthorne debería ser igual
cuándo es preocupante el efecto Hawthorne
- En estudios no aleatorizados
- Cuasiexperimentos
- Cuando solo un grupo de estudio es consciente de la observación
que es el sesgo de desgaste?
- En un ensayo clínico aleatorizado (ECA) o en un estudio de cohorte observacional, algunos participantes invariablemente abandonan el estudio por múltiples motivos.
existe una cantidad definitiva de diserción o pérdida de seguimiento para que el sesgo de deserción sea un problema reconocido?
- No
- Pero existe la regla 5 y 20 - <5% de deserción resulta en poco sesgo
- > 20% amenaza la validez del estudio
en que caso la regla 5 y 20 no tiene utilidad?
- en estudios con resultados poco frecuentes o raros
- Fragilidad de los hallazgos
Este sesgo es más frecuente en un grupo que en el otro
Sesgo de clasificación errónea o informativo
es una distorsión de los hallazgos del estudio que resulta de los factores que determinan la participación en el estudio, específicamente, el procedimiento o la forma en que se seleccionan los sujetos del estudio.
El sesgo de selección
Método más efectivo y simple para prevenir el sesgo de selección en un ECA
Aleatorización simple
es una variable que se correlaciona (positiva o negativamente) tanto con la exposición como con el resultado.
Variable de confusión
La variable confusión puede…
- Ser un problema en cualquier estudio observacional (no aleatorizado)
- Ignorar los factores de confusión en un estudio observacional a menudo resultará en una estimación distorsionada o incorrecta de la asociación o del efecto del tratamiento
Una variable de confusión debe ocurrir o medirse…
Antes de la variable de exposición (o periodo de exposición)
se ubica a lo largo de la vía causal entre la exposición y el resultado
- variable mediadora
- Ocurre como resultado de la exposición y es una causa que contribuye al resultado
no suele ser un problema en un ensayo aleatorio porque los grupos aleatorios están suficientemente equilibrados en todas las posibles variables de confusión, tanto observadas como no observadas
La confusión
Es una fuente común de confusión
El sesgo de selección
¿cómo controlo la confusión?
- Aleatorización
- Restricción de elegibilidad del estudio
- Emparejamiento de participantes a priori
Otro nombre para la interacción entre variables…
¿que es?
ejemplo?
- Modificación de efecto
- Existe cuando el efecto de una variable explicativa sobre el resultado depende del nivel o valor particular de otra variable explicativa.
- Por ejemplo, los investigadores podrían encontrar que el efecto del anestésico A versus el anestésico B en el resultado de interés es más fuerte (o incluso en direcciones opuestas) para los hombres que para las mujeres, lo que indica una interacción entre el efecto de la elección del anestésico y el género en el resultado.
se utiliza para describir las características básicas de los datos del estudio.
Estadística descriptiva
Proporciona resúmenes simples sobre la muestra y las medidas
Estadística descriptiva
Se utilizan medidas de tendencia central y dispersión para describir los datos…
Cuantitativos
Cuando nuestros datos siguen una distribución normal, se utilizan pruebas…
Paramétricas
Cuando nuestros datos NO siguen una distribución normal, se utilizan…
Pruebas no paramétricas
es el tipo de información que se presenta en unas pocas palabras para describir las características básicas de los datos de un estudio, como la media y la desviación estándar (DE).
Estadística descriptiva
que extrae conclusiones de datos que están sujetos a variación aleatoria (por ejemplo, errores de observación y variación de muestreo). En estadística inferencial, la mayoría de las predicciones son para el futuro y generalizaciones sobre una población mediante el estudio de una muestra más pequeña.
Estadística inferencial
3 tipos principales de descriptivos
- Medidas de frecuencia
- frecuencia
- porcentaje - Medidas de tendencia central
- media
- mediana
- moda - Medidas de dispersión o de variación
* Varianza
* Desviación estándar
* Error estándar
* Cuartil
* Rango intercuartil
* Percentil
* Rango
* Coeficiente de variación
simplemente cuentan el número de veces que ocurre en cada variable, como el número de hombres y mujeres dentro de la muestra o población
Medidas de frecuencia
las medidas de tendencia central también se llaman
medidas de primer orden
La media se ve afectada por…
outliers
también se llama promedio posicional y no está afectada por outliers
- Mediana
se utiliza para mostrar cuán dispersa (variación) hay en un conjunto de datos
- Medidas de dispersión
- Específicamente, muestra una falta de representación de medidas de tendencia central, generalmente para la media/ mediana.
Es un paso importante para decidir las medidas de tendencia central y los métodos estadísticos para el análisis de datos
- Pruebas de normalidad
Se define como el promedio de la diferencia al cuadrado de la media
Varianza
- Es igual al cuadrado de la desviación estándar
¿a qué es igual la varianza?
Es igual al cuadrado de la desviación estándar
Definición del error estándar
- El error estándar es la diferencia aproximada entre la media de la muestra y la media de la población
- La desviación estándar entre las medias muestrales se denomina error estándar
Que es el coeficiente de variación?
- Es una medida estadística que se utiliza para expresar la variabilidad relativa de una distribución de datos en relación con su media
- El coeficiente de variación proporciona una medida de la dispersión de los datos en relación con su promedio.
- Un coeficiente de variación alto indica gran variabilidad relativa en los datos en comparación a su media, mientras que un coeficiente de variación bajo indica una variabilidad relativa menor en relación a la media.
- Fórmula
- (desviación estándar/media) x 100%
Es la distribución de probabilidad continua más importante, tiene una curva de densidad en forma de campana descrita por su media y DE y los valores extremos en el conjunto de datos no tienen un impacto significativo en el valor medio.
Distribución normal estándar
Si los datos continuos siguen una distribución normal, entonces el …
68,2%, el 95,4% y el 99,7% de las observaciones se encuentran entre la media ± 1 DE, la media ± 2 DE y la media ± 3 DE, respectivamente
QUÉ establece el teorema de límite central?
Establece que cuando el tamaño de la muestra tiene 100 o más observaciones, la violación de la normalidad no es un problema importante
Si nuestros datos no se distribuyen normalmente, entonces…
La media resultante no es un valor representativo de nuestros datos
Es un requisito previo para muchas pruebas estadísticas porque los datos normales son un supuesto subyacente en las pruebas paramétricas.
Una evaluación de la normalidad de los datos
¿cuáles son los 2 métodos para evaluar la normalidad?
- Gráficos
- La evaluación de normalidad mediante gráficos requiere mucha experiencia, por eso si es que no tenemos mucha experiencia lo mejor es confiar en los métodos numéricos - Numéricos
- No son lo suficientemente sensibles
- Shapiro Wilk
- Kolmogorov - Smirnoff
Métodos numéricos más populares para evaluar normalidad
- Shapiro-Wilk
- Kolmogorov – Smirnov
- La asimetría
- La curtosis
- Histograma
- Diagrama de caja
- Diagrama P-P y diagrama Q-Q
- Media con SD
Las 2 pruebas de normalidad más conocidas a saber son (métodos más utilizados para probar la normalidad de los datos):
- Kolmogorov – smirnov
- Se utiliza para n ≥ 50 - Shapiro - Wilk
- n<50
- Tamaño de muestra pequeño
- Esto no significa que no podramos usarlo en muestras más grandes
Cómo es la hipótesis nula en Kolmogorov – smirnov y shapiro-wilk?
Para estas 2 pruebas la hipótesis nula establece que los datos se toman de una población distribuida normal. Cuando P>0,05, se acepta la hipótesis nula y los datos se consideran distribuidos normalmente.
Es una medida del pico de una distribución
- La curtosis
- Si la media, la mediana y la moda de una distribución coinciden, entonces se llama distribución simétrica, es decir, asimetría = 0, curtosis (exceso) = 0.
Una distribución se llama normal aproximada si la asimetría o curtosis (exceso) de los datos…
Está entre -1y +1
Que sucede con el error estándar a medida que aumenta el tamaño de muestra?
El error estándar disminuye
es una estimación de la distribución de probabilidad de una variable continua
- Histograma
- Si la gráfica tiene aproximadamente forma de campana y es simétrica con respecto a la media, podemos asumir datos distribuidos normalmente
Si la DE es inferior a la mitad de la media (es decir, CV <50%)
Los datos se consideran normales
Para que datos la prueba de normalidad es muy importante
Datos continuos
se debe utilizar la prueba de ____ ya que tiene más poder para detectar la anormalidad.
Shapiro-Wilk
Que preguntas hacerme segun la validez externa e interna?
(1) ¿puedo confiar en las conclusiones de este estudio? (validez interna)
(2) ¿puedo aplicar estas conclusiones a mis pacientes? (validez externa)
cualquier proceso en cualquier etapa de inferencia que tiende a producir resultados o conclusiones que difieren sistemáticamente de la verdad
Sesgo
El sesgo puede ocurrir en 3 etapas…
- Durante la inscripción inicial de los participantes
- Durante la implementación del estudio
- Durante el análisis de los hallazgos
la primera fuente de sesgo…
Surge de la ausencia de un grupo control en los estudios descriptivos
ocurre si la población del estudio no refleja una muestra representativa de la población objetivo.
Sesgo de selección
- Por lo tanto la validez externa es cuestionable
Un sesgo aún más grave surge si el sesgo de selección es ______, es decir, si la forma en que se seleccionaron los pacientes difiere entre dos o más grupos.
- Diferencial
- Las medidas de asociación (índice de tasas, índice de posibilidades, índice de riesgos) están distorsionadas y la validez interna es cuestionable
En el contexto de sesgo de clasificación.
Si las clasificaciones erróneas ocurren al azar, se dice que el sesgo es…
Si las clasificaciones erróneas están relacionadas con la exposición, el estado de los resultados o la asignación del tratamiento, el sesgo de clasificación…
- No diferencial
- Diferencial
Previene el sesgo de clasificación diferencial
Cegamiento
Son mas sesgados que cualquier otro tipo de estudio…
Estudios retrospectivos
No experimentan sesgos debido a la aleatorización
Ensayos controlados aleatorios
Hipótesis nula que se busca rechazar en estudios analíticos
En los estudios analíticos, la hipótesis nula que se busca rechazar es la de que no hay diferencias entre grupos
Cuando el sesgo no es diferencial, es decir, cuando las oportunidades de sesgo son equivalentes en todos los grupos de estudio, la medida de resultado está sesgada hacia lo nulo. Cuando el sesgo es diferencial, es decir, cuando las oportunidades de sesgo son diferentes en los diferentes grupos de estudio, la medida de resultado puede ser sesgado en ambos sentidos, ya sea hacia o alejándose de lo nulo. Por ejemplo, el sesgo de recuerdo de un estudio de casos y controles, descrito anteriormente, tiende a sobrestimar el vínculo entre la historia de los casos y la enfermedad: esto es un alejamiento del sesgo nulo. Sin embargo, no siempre se puede predecir la dirección de un sesgo diferencial.
…
El lector crítico debe evaluar varios aspectos del diseño, la realización y el análisis del estudio con respecto a los tres tipos principales de sesgo:
(1) sesgo de selección: ¿son los sujetos del estudio correspondientes a la población objetivo y son los sujetos de los brazos del estudio? comparable
(2) Sesgo de clasificación: cómo se recopiló la información sobre la exposición y la enfermedad, y si la información se recopiló de manera comparable
(3) Sesgo de confusión: ¿ha habido un esfuerzo sistemático para identificar y medir posibles factores de confusión y hay información sobre cómo se distribuyen los posibles factores de confusión entre los grupos de comparación?
Muchas pruebas estadísticas parten del supuesto de varianza igual.
Si este supuesto es violado, entonces…
Los resultados no serán confiables
Las pruebas y procedimientos estadísticos más comunes que hacen este supuesto de igual varianza incluyen:
- ANOVA
- Pruebas t
- Regresión lineal
Se utiliza para determinar si existe o no una diferencia significativa entre las medias de tres o más grupos independientes.
- ANOVA
- Supongamos que reclutamos a 90 personas para participar en un experimento de pérdida de peso. Asignamos aleatoriamente a 30 personas para que utilicen el programa A, B o C durante un mes. Para ver si el programa tiene un impacto en la pérdida de peso, podemos realizar una ANOVA unidireccional.
Un ANOVA supone que…
Cada uno de los grupos tiene la misma varianza
Con ANOVA hay 2 maneras para comprobar si se cumple el supuesto de varianza igual…
- Crear diagrama de cajas
- Revisar con el word - Prueba de Bartlett
- Prueba la hipótesis nula de que las muestras tienen varianzas iguales frente a la hipótesis alternativa de que las muestras no tienen varianzas iguales.
- Si el valor p de la prueba es menor que algún nivel de significancia (como 0,05), entonces tenemos evidencia para decir que no todas las muestras tienen varianzas iguales
¿Que hacemos se se viola el supuesto de igual varianza en ANOVA?
Si los tamaños de muestra no son los mismos y este supuesto se viola gravemente, se podría ejecutar un Prueba de Kruskal-Wallis, que es la versión no paramétrica del ANOVA unidireccional.
Versión no paramétrica del ANOVA unidireccional
Prueba de Kruskal - Wallis
Para que utilizamos la prueba t de dos muestras?
- Se utiliza para probar si las medias de 2 poblaciones son iguales o no
- Esta prueba supone que las varianzas son iguales entre los 2 grupos - Dos formas de comprobar si se cumple este supuesto
- Proporción de regla general
- Prueba F (F-TEST) - Si no se cumple
- T de Welch
¿que hacemos si se viola el supuesto en prueba t?
Si se viola esta suposición entonces podemos realizar prueba t de Welch, que es una versión no paramétrica de la prueba t de dos muestras y no supone que las dos muestras tengan varianzas iguales.
versión no paramétrica de la prueba t de dos muestras y no supone que las dos muestras tengan varianzas iguales.
Prueba de t de welch
La regresión lineal supone…
- Los residuales tienen una varianza constante en cada nivel de la(s) variable(s) predictora(s)
- Homocedasticidad - Cuando este no es el caso se dice que los residuos sufren heterocedasticidad y los resultados del análisis se vuelven poco confiables
Forma más común de determinar si se cumple el supuesto de homocedasticidad en regresión lineal
Crear una gráfica de residuos versus valores ajustados
¿que hacemos si se viola el supuesto de igual varianza en regresión lineal?
- la forma más común de abordarlo es transformar la variable de respuesta utilizando una de las tres transformaciones:
- Log Transformation: Transform the response variable from y to log(y).
- Square Root Transformation: Transform the response variable from y to √y.
- Cube Root Transformation: Transform the response variable from y to y
Al realizar estas transformaciones, el problema de la heteroscedasticidad suele desaparecer.
Otra forma de corregir la heteroscedasticidad…
utilizar regresión de mínimos cuadrados ponderada
Signo de desviación estándar
1 Sigma
- “σ” o S
La distribución normal tiene forma de campana y está decrita por su…
Media y s (DE)
que valores no afectan a la mediana
Los outliers
para shapiro wilk y Kolmogorov - smirnoff ¿Cuál es su hipótesis nula?
H0:Que los datos se toman de una población con distribución normal
Si la media, la mediana y la moda de una distribución coinciden, entonces se llama…
- Distribución simétrica
- Asimetría=0 y curtosis=0
Cuando se afecta la validez interna con el sesgo de selección
Cuando el sesgo de selección es diferencial
- ¿son los sujetos del estudio correspondientes a la población objetivo y son los sujetos de los brazos del estudio?
- cómo se recopiló la información sobre la exposición y la enfermedad, y si la información se recopiló de manera comparable
- ¿ha habido un esfuerzo sistemático para identificar y medir posibles factores de confusión y hay información sobre cómo se distribuyen los posibles factores de confusión entre los grupos de comparación?
- Sesgo de selección
- Sesgo de clasificación
- Sesgo de confusión