Clase 3: Principales técnicas multivariadas Flashcards

1
Q

Qué son las Técnicas Multivariadas o Multivariantes?

A
  1. El análisis multivariante engloba un grupo de técnicas o métodos estadísticos cuya finalidad es analizar simultáneamente conjuntos de datos multivariantes en el sentido de que hay varias variables medidas para cada individuo u objeto estudiado
  2. Por ejemplo, numerosos factores están asociados con el desarrollo de enfermedades coronarias, incluyendo tabaquismo, obesidad, estilo de vida sedentario, diabetes, niveles elevados nivel de colesterol e hipertensión
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

¿porqué existen las técnicas de análisis multivariadas?

A
  1. Por que los métodos univariados o bivariados son incapaces de explicar un determinado fenómeno.
  2. Para comprender mejor un fenómeno.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

La estadística multivariante se refiere a…

A

Diferentes métodos que estudian y examinan el efecto simultáneo de múltiples variables

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

EMPECEMOS CON UN EJEMPLO: EL ANALISIS UNIVARIADO ES IMPORTANTE PERO

A

NO EXPLICA LAS RELACIONES O INFLUENCIAS ENTRE LAS VARIABLES INDEPENDIENTES Y DEPENDIENTES (DE RESULTADO)…

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

¿las técnicas multivariante hacen posible que cosa?

A
  1. Establecer relaciones entre las variables independientes y dependientes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Tipos de técnicas multivariantes

A
  1. Métodos de dependencia
    - Dependiente métrica
    - Dependiente no métrica
  2. Métodos de interdependencia
    - Datos métricos
    - Datos no métricos
  3. Modelos estructurales
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

¿qué son los distintos métodos de las técnicas multivariantes?

A
  1. Métodos de dependencia Éstos suponen que las variables analizadas están divididas en dos grupos: las variables dependientes y las variables independientes. El objetivo de los métodos de dependencia consiste en determinar si el conjunto de variables independientes afecta al conjunto de variables dependientes y de qué forma.
  2. Métodos de interdependencia
    Estos métodos no distinguen entre variables dependientes e independientes y su objetivo consiste en identificar qué variables están relacionadas, cómo lo están y por qué.
  3. Modelos estructurales
    Suponen que las variables están divididas en dos grupos: el de las variables dependientes y el de las independientes. El objetivo de estos es analizar, no sólo cómo las variables independientes afectan a las variables dependientes, sino también cómo están relacionadas las variables de los dos grupos entre sí.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Métodos de dependencia

A

Métodos de dependencia.
Dependencia métrica (variables cuantitativas de razón o escala).

  1. Análisis de Regresión.
    Es la técnica adecuada si en el análisis hay una o varias variables dependientes métricas
    cuyo valor depende de una o varias variables independientes métricas.
    Por ejemplo, intentar predecir el gasto anual en cine de una persona a partir de su nivel de
    ingresos, nivel educativo, sexo y edad.
  2. Análisis de Supervivencia.
    Es similar al análisis de regresión pero con la diferencia de que la variable dependiente
    es el tiempo de supervivencia de un individuo u objeto.
  3. Análisis de la varianza.
    Se utilizan en situaciones en las que la muestra total está dividida en varios grupos
    basados en una o varias variables independientes no métricas y las variables dependientes
    analizadas son métricas
    Por ejemplo, ¿hay diferencias en el nivel de colesterol por sexos? ¿Afecta, también, el tipo
    de ocupación?
  4. Correlación Canónica.
    Su objetivo es relacionar simultáneamente varias variables métricas dependientes e
    independientes calculando combinaciones lineales. Por ejemplo, analizar cómo está
    relacionado el tiempo dedicado al trabajo y al ocio de una persona con su nivel de
    ingresos, su edad y su nivel de educación.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Métodos de dependencia no métrica (variables cualitativas)

A

Dependencia no métrica (variables cualitativas)

Análisis Discriminante.
Este método de análisis permite, en primer lugar, determinar cuáles son las variables (de
entre una serie de variables seleccionadas previamente por el investigador) que mejor
explican la pertenencia de un individuo a un determinado grupo.

2- Modelos de regresión logística.
Son modelos de regresión en los que la variable dependiente es no métrica. Se utilizan
como una alternativa al análisis discriminante cuando no hay normalidad.

  1. Análisis Conjoint. O de Diseño de Experimentos
    Es una técnica que analiza el efecto de variables independientes no métricas sobre
    variables métricas o no métricas. La diferencia con el Análisis de la Varianza radica en
    dos hechos: las variables dependientes pueden ser no métricas y los valores de las
    variables independientes no métricas son fijadas por el analista.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

métodos de interdependencia

A

Métodos de Interdependencia.
Dependencia métrica.

  1. Análisis Factorial y Análisis de Componentes Principales.
    Se utiliza para analizar interrelaciones entre un número elevado de variables
    métricas explicando dichas interrelaciones en términos de un número menor
    de variables denominadas factores (si son inobservables) o componentes
    principales (si son observables).
    Si un psicólogo quiere determinar los factores que caracterizan la inteligencia
    de un individuo a partir de sus respuestas a un test de inteligencia, utilizaría
    para resolver este problema un Análisis Factorial.
  2. Escalado Multidimensional (MDS).
  3. Análisis Cluster: Su objetivo es clasificar una muestra de entidades (individuos o variables) en un número pequeño de grupos de forma que las
    observaciones pertenecientes a un grupo sean muy similares entre sí o
    diferentes entre ellos.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

métodos de dependencia no métrica

A
  1. Análisis de Correspondencias
  2. Modelos log-lineales
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Guía para la correcta aplicación de las técnicas multivariantes. planteado por Hair et al.

A
  1. Definición del problema que se está investigando: objetivos, elección de la técnica multivariante (requisitos: análisis conceptual del problema a investigar).
  2. Revisar y confirmar que la muestra posea un tamaño que permita su aplicación, que los instrumentos hallan medido las variables con las escalas pertinentes (métricas y/o no métricas).
  3. Análisis de las condiciones de aplicabilidad de la técnica elegida: tras haber recogido los datos. Que se cumplan los supuestos que la técnica exija. Las técnicas de dependencia, por ejemplo, suele ser necesario que los datos verifiquen hipótesis de normalidad, linealidad, independencia y homocedasticidad (Linealidad: Que la relación entre las variables sea lineal. - Independencia: Que los errores en la medición de las variables explicativas sean independientes entre sí. - Homocedasticidad: Que los errores tengan varianza constante. - Normalidad: Que las variables sigan la Ley Normal).
  4. Estimación del modelo multivariante y se evalúa si el nivel de bondad del ajuste es adecuado
    (Las pruebas de bondad de ajuste son pruebas que permiten identificar a que distribución de
    probabilidad pertenece la muestra (uniforme, exponencial, normal, poisson, u otra cualquiera).
  5. Interpretación de los resultados: luego de que se logra un nivel de ajuste aceptable, se procede
    a interpretar el modelo.
  6. Validación del modelo: previo a la aceptación de los resultados a los que se haya llegado, debe
    aplicarse una serie de técnicas de diagnóstico que aseguren que los resultados obtenidos
    pueden ser generalizados al conjunto de la población
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

ver tablas en el ppt

A

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

TIPO DE VARIABLE PARA CADA UNA
1. Dependencia metrica
2. Dependencia no metrica

A
  1. → de variables cuantitativas
  2. → de variables cualitativa
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Explícame los métodos

A
  1. Métodos de dependencia
    - Variables analizadas están divididas en 2 grupos (variables dependientes e independientes)
    - Se quiere ver si el grupo de variables independientes afecta a las dependientes y de que forma
  2. Métodos de interdependencia
    - No distinguen entre variables dependientes o independientes
    - Identifica la relación entre variables
  3. Modelos estructurales
    - Variables analizadas están divididas en 2 grupos (dependientes e independientes)
    - Aparte de ver como las variables independientes afectan a las dependientes…
    - Se ve cómo están relacionadas las variables de los 2 grupos entre sí
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Requisitos de una variable confusora

A
  1. Tiene relación con la exposición (variable independiente)
  2. Tiene relación causal con el outcome (variable dependiente)
  3. No debe ser ser un resultado de la exposición
  4. No debe ser un paso intermedio en el camino causal
17
Q

Tipos de análisis multivariados y con qué variables se utilizan?

A
  1. Regresión lineal múltiple
    - Resultados de intervalo
    - E.g. PA
  2. Regresión logística
    - Resultados dicotómicos
    - Da una probabilidad de resultados limitada de 0 y 1
    - Tiene o no tiene
    - Muerto o no muerto
  3. Regresión de riesgos proporcionales
    - Se utiliza en análisis de supervivencia
    - Útil en estudios longitudinales donde las personas pueden perderse en el camino
    - Tiene el SUPUESTO DE PROPORCIONALIDAD
18
Q

Número que representa la relación entre dos variables en un modelo de regresión

A

Coeficiente de regresión

19
Q

Tipo de análisis multivariable que porta el supuesto de proporcionalidad

A

Regresión de riesgos proporcionales

20
Q

Ventaja de la regresión de riesgos de proporciones

A

Incluye personas con diferentes duraciones de seguimientos

21
Q

la mejor manera de evaluar si un modelo se ajusta a los datos

A
  1. Análisis de residuales
    - Es la diferencia entre los valores observados y estimados
  2. Si el residuo sale grande es que el modelo no se ajusta a los datos
22
Q

Regla general

A
  1. Para tener confianza en los resultados, debe haber al menos 20 personas por cada variable independiente elegible para ser incluida en un modelo de regresión lineal
  2. Al menos 10 resultados por cada variable independiente elegible para ser incluida en una regresión logística o modelo de proporción de hazard