Analisis De Correlacion Y De Regresion Flashcards
Qué es el análisis multivariante
Es un conjunto de Test estadísticos que se aplica cuando se intenta establecer la asociación estadística entre dos variables, pero controlando el efecto de terceros factores que podrían actuar como factores de confusión o modificadores del efecto.
Ejemplo de un análisis multivariante
Por ejemplo, se desea saber si existe una relación entre la infección de herida quirúrgica y el tipo de cirugía, controlando que la profilaxis antibiótica empleada no actúe como factor de confusión.
1- Para ello se trataría de establecer una expresión lógica como la siguiente:
• El riesgo de infección de herida quirúrgica DEPENDE DE tipo de profilaxis Y tipo de cirugía.
2- Incluso se podría añadir otras variables, de ahí el nombre de multivariante, como las que sigue:
- El riesgo de infección de herida quirúrgica DEPENDE DE tipo de profilaxis Y tipo de cirugía Y edad del paciente Y tiempo de cirugía….
- Se debe expresar esta relación de forma matemática, resultando algo así:
Probabilidad (Infección de herida)= profilaxis + tipo de cirugía + edad + tiempo de cirugía.
3- Siempre que se relacione matemáticamente, en forma de una ecuación, una variable con otra u otras, se está generando una ecuación de regresión:
• La variable que se coloca antes del igual será la variable DEPENDIENTE, puesto que sus valores dependerán de los valores que tomen las variables que están después del igual o variables INDEPENDIENTES.
Cuantos tipos de regresión hay
Existen muchos tipos de regresión que vienen determinados por la naturaleza de la variable dependiente:
- Esto es, si es cuantitativa, cualitativa, etc.
Qué es lo que se consigue al formular un ecuación de regresión
1- Al final, lo que se consigue al formular una ecuación de regresión con los datos de un estudio es generar un modelo matemático que pretende explicar el comportamiento de las variables incluidas.
2- Al terminar el análisis, el modelo de regresión proporcionará una estimación del riesgo asociado a cada una de las variables, y este riesgo es independiente para cada una de ellas.
• El riesgo viene en forma de: OR, RR o HR.
Cuáles son los tipos de análisis multivariantes
1- Si tengo una variable dependiente cualitativa, por ejemplo IAM. si/no:
- El Test estadístico que emplearé es la regresión logística.
- La medida de asociación será: OR, riesgo relativo.
2- Si tengo una variable dependiente cuantitativa, por ejemplo carga viral.
• El Test estadístico que emplearé es la regresión lineal múltiple.
3- Si tengo una variable dependiente de supervivencia, por ejemplo tiempo hasta la oclusión de un stent/bypass (datos de supervivencia).
- El Test estadístico que emplearé es la regresión de Cox
- La medida de asociación será el Hazard ratio o HR.
Dentro del análisis multivariante, qué tipo de Test estadístico haré si mi variable dependiente es cualitativa
1- Cuali + Cuali:
• Hare test de regresión logística.
2- medidas de asociación: OR, RR.
Dentro del análisis multivariante, qué tipo de Test estadístico haré si mi variable dependiente es Cuantitativa
1- Cuanti + Cuanti:
• Regresión lineal múltiple.
Dentro del análisis multivariante, qué tipo de Test estadístico haré si mi variable dependiente es: tiempo hasta oclusion de un stent/BP (datos de SPV)
1- Cuali + tiempo hasta cualitativa (SPV):
• regresión de Cox.
2- medidas de asociación: HR
Cuáles son las características de la regresión lineal
1- Le ecuación de la regresión lineal más sencilla o regresión lineal simple tiene la forma siguiente:
y = alfa + beta x
- Alfa y beta son los llamados coeficientes de regresión.
- y es la variable dependiente
- x es la variable independiente.
- El coeficiente alfa representa el punto en el que la línea corta el eje vertical (valor de y para x = 0).
- El coeficiente beta es la pendiente de la recta (puesto que la figura que genera la ecuación es una recta) que muestra la cantidad que varía y por una unidad de cambio de x.
Ejemplo de una regresión lineal
1- Por ejemplo, se quiere plantear la existencia de asociación entre el índice de masa corporal y la colesterolemia plasmática. Se generará una ecuación como está:
• IMC = alfa + beta x colesterolemia.
2- Imagínese un resultado hipotético como este:
- IMC= 0,25 + 1,86 x colesterolemia.
- El coeficiente beta se interpretará de esta forma: Cada unidad que aumenta la colesterolemia, por ejemplo de 200 a 201 mg/dl, el IMC aumentaría 1,86 puntos.
Qué tipo de gráficas podemos tener en una regresión lineal
1- Una relación lineal positiva es la Vía Láctea que va de cuadrante inferior izquierdo a cuadrante superior derecho.
2- Una relación lineal negativa es la Vía Láctea que va desde cuadrante superior izquierdo a cuadrante inferior derecho.
3- Falta de relación: Muestra una imagen dispersa, que ocupa Los cuatro cuadrantes.
4- Una relación no lineal: muestra un arcoíris que va desde el cuadrante inferior izquierdo al cuadrante inferior derecho, tiene forma arciforme convexo hacia arriba, ocupando los cuadrantes superiores.
Qué otra forma tenemos para analizar la posible asociación entre dos variables continuas
Se puede hacer un análisis de correlación por medio del coeficiente de correlación de Pearson
Qué es el coeficiente de correlación de Pearson
1- Es un análisis de correlación, mide la intensidad de la relación lineal entre las dos variables cuantitativas.
2- En general, si se tiende a realizar primero un análisis de correlación, y de este resulta una asociación fuerte entre variables, se intentará formular una ecuación de regresión lineal.
Cuáles son las características del coeficiente de correlación de Pearson
Las características son las siguientes:
• Varía entre -1 a+1 ———> -1 < o = r < o = +1.
1- Para r = +/- 1, hay una relación perfecta entre x e y, es decir, que todos los puntos (x,y) están en una línea recta.
- Un valor positivo de r indica que a medida que aumente una variable, lo hace la otra, o conforme disminuye una, también lo hace la otra.
- Un coeficiente de correlación negativo denota que a medida que disminuye una variable, aumenta la otra o viceversa.
- r= 0 indica que no hay correlación lineal.
Qué es la regresión logística
1- Le ecuación de regresión logística es matemáticamente mucho más compleja, pero desde un punto de vista conceptual, es exactamente igual a la regresión lineal salvo por el tipo de variable dependiente, que es cualitativa dicotomica.
2- El final de un análisis de regresión logística, como se ha comentado anteriormente, da lugar a una cuantificación del riesgo asociado a cada una de las variables independientes incluidas.
3- Por ejemplo en una tabla de análisis de regresión logística interesa ver las variables independientes, y los valores de Exp(B) y sus intervalos de confianza, puesto que representarian el valor del RR u OR y intervalo de confianza respectivamente.
Así, tenemos los siguientes datos:
- Riesgo de infección de herida sería de 1,03 (IC: 1,021-1,041) si se hace profilaxis ( es un OR o un RR, en función del estudio).
- De 1,024 (IC: 0,733-1,034) cada daño que se aumenta en la edad (no significativo)
- De 4,118 (IC: 1,740-9,650) por cada hora que aumenta el tiempo quirúrgico.