Clase 9: Regresión lineal: Univariada - Múltiple Flashcards

1
Q

La regresión lineal univariada se usa para analizar la relación entre 2 variables…

A

Cuantitativas

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Las técnicas más utilizadas para investigar la relación entre dos
variables cuantitativas son:

A
  1. Correlación
  2. Regresión lineal
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

¿Cuál es la diferencia entre correlación y regresión lineal?

A
  1. Correlación:
    - La correlación cuantifica la fuerza de la relación lineal entre un par de variables
  2. Regresión lineal:
    - Expresa la relación en forma de ecuación
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Al investigar una relación entre dos variables, el primer paso es mostrar
los valores de los datos…

A

Gráficamente en un diagrama de dispersión

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Cómo interpreto un diagrama de difusión?

A
  1. Cuanto más cerca estén los puntos de una línea recta, más fuerte será la relación lineal entre 2 variables
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

¿como cuantifico la fuerza de la relación?
(correlación)

A
  1. Calculando el coeficiente de CORRELACIÓNN: “r”
    - Este es el coeficiente de relación del momento del producto (Coeficiente de correlación de pearson)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Valores e interpretación del coeficiente de CORRELACIÓN

A
  1. El valor se encuentra entre -1 a +1
  • Un valor del coeficiente de correlación cercano a +1 indica una fuerte relación lineal positiva (es decir, una variable aumenta con la otra
  • Un valor cercano a –1 indica una fuerte
    relación lineal negativa (es decir, una variable disminuye a medida
    que la otra aumenta
  • Un valor cercano a 0 indica que no hay
    relación lineal
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hipótesis nula de la CORRELACIÓN

A

El coeficiente de CORRELACIÓN de la población es igual a 0
Osea no hay relación lineal entre las 2 variables

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Aunque la prueba de hipótesis indica si existe una relación lineal, no
da ninguna ___________.
Esta adicional se obtiene a partir del _____

A
  1. Indicación de la fuerza de esa relación
  2. Intervalo de confianza para el coeficiente de CORRELACIÓN poblacional
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Ya hemos dicho que para indicar la fuerza de la relación hacemos el cálculo del intervalo de confianza
¿Cuáles son los pasos para obtenerlo?

A
  1. Primero transformamos “r” para que nos de una distribución normal mediante la “Transformación z de Fisher”
    - “Zr”
  2. En segundo lugar calculamos el ERROR ESTÁNDAR: 1/ raiz cuadrada de n-3
  3. Por último,
    - IC del 95%: Zr - (1.96 x EE) a Zr + (1.96 x EE)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

¿De qué depende la amplitud del intervalo de confianza?

A
  1. Del tamaño de muestra
    - por lo tanto, es posible calcular el tamaño
    de muestra requerido para un nivel dado de precisión
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Uno de los errores más comunes al interpretar el coeficiente de correlación es…

A

No considerar que puede haber una tercera variable relacionada con ambas variables investigadas, que es responsable de la aparente correlación.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Dato importantísimo de la CORRELACIÓN

A

LA CORRELACIÓN NO IMPLICA CAUSA
- IMPLICA ASOCIACIÓN

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Otra situación en la que a veces se malinterpreta un coeficiente
de correlación es cuando s

A

Se comparan dos métodos de
medición.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Queremos estimar la relación lineal subyacente para poder predecir la urea (y por tanto la urea) para una edad determinada.
¿Qué podemos utilizar?

A

Se puede utilizar regresión lineal para encontrar la ecuación de la recta
- Suele denominarse línea de regresión

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

en un diagrama de dispersión la variable de respuesta
siempre se traza en

A

el eje vertical (y).

17
Q

La ecuación de una línea recta viene dada por

A

r y = a + bx,

18
Q

son la intersección de la línea en el eje y y el
gradiente, respectivamente
(en el contexto de la ecuación de una línea)

A

Los coeficientes a y b

19
Q

¿Cómo se obtiene la recta de regresión?

A
  1. Mediante el método de cuadrados mínimos
20
Q

Para un valor particular de x, la diferencia
vertical entre el valor observado y ajustado de y se conoce como

A

Desviación o residual

21
Q

¿qué hace el método de mínimos cuadrados?

A
  1. Minimiza la suma de los cuadrados de las desviaciones de los puntos con respecto a la recta de regresión
  2. Esta técnica es la que me elije mejor la línea
22
Q

Cómo se denomina la suma de cuadrados explicada y no explicada?

A
  1. Suma de cuadrados explicada
    - Suma de cuadrados de regresión
  2. Suma de cuadrados no explicada
    - Suma de cuadrados residual
23
Q

a que son iguales los cuadrados medios?

A

Los cuadrados medios son la suma de
cuadrados divididos por sus grados de libertad

24
Q

Si no hubiera una relación lineal entre las variables, entonces…

A
  1. Los cuadrados medios de la regresión serían aproximadamente iguales
    que los cuadrados medios residuales.
  2. Podemos probar la hipótesis
    nula de que no existe una relación lineal utilizando una “PRUEBA F”
25
Q

a prueba F del
análisis de varianza es equivalente a la…

A

Prueba t del gradiente para regresión con un solo predictor

26
Q

Como se analizó
anteriormente, la prueba de gradiente también es equivalente a…

A

La de CORRELACIÓN, dando 3 pruebas con resultados p idénticos

27
Q

¿Qué es el coeficiente de determinación?

A

(R2)
1. Es la proporción de la variación total en y explicada por el modelo de
regresión.

  1. (R2) es la proporción de la variación en la variable dependiente que es explicada por las variables independientes en el modelo.
  2. Indica la proporción de la varianza de la variable respuesta que es
    explicado por el conjunto de variables predictoras.
28
Q

Supuestos de la regresión lineal

A
  1. Observaciones INDEPENDIENTES
  2. Ambas variables deben ser
    variables ALEATORIAS, pero para la regresión solo la variable de respuesta y debe ser aleatoria
  3. Variable respuesta debe de tener una DISTRIBUCIÓN NORMAL
  4. Tanto la correlación
    como la regresión suponen que la relación entre las dos variables es
    LINEALIDAD.
    ———————————————————————————–
  5. Distribución normal
  6. Linealidad
  7. Independencia
  8. Homocedasticidad
29
Q

proporciona una verificación
inicial de los supuestos de regresión.

A

Diagrama de dispersión de datos

30
Q

¿Qué veremos en el gráficos de dispersión si los residuos tienen una distribución normal)

A
  1. Este gráfico mostrará una línea recta.
  2. (Una distribución
    normal estándar es una distribución normal con media = 0 y
    desviación estándar = 1)
31
Q

Un fenómeno que debe tenerse en cuenta y que puede surgir con
mediciones repetidas de individuos es la

A

Regresión de la media