Correlation & Regression Flashcards

1
Q

Qué presupuestos tiene la regresión lineal

A
  1. Linealidad: se prueba con gráficos de dispersión.

En la distribución de residuos se debe mostrar:

  1. Normalidad: se prueba con el gráfico QQ
  2. Homogeneidad de la varianza
  3. Independencia
  4. Falta de colinealidad : se prueba con la variance inflation factor
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

qué significa la falta de colinealidad y para qué importa en la regresión

A

No se quiere que los predictores tengan una correlación fuerte entre ellos. Que la tengan puede causar problemas evaluando el modelo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Cuáles son las diferencias del error estándar de la regresión

A

El error estándar del coeficiente de regresión depende de las variables (ambas: independientes y dependientes) y es sensitivo a violaciones de la homogeneidad de las varianzas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

La correlación y la regresión lineal qué miden o qué tienen en común

A

Ambas describen la relación entre variables

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Para qué sirven los scatterplots (diagramas de dispersión)

A

Dan una idea general de qué tan cercana es la relación entre dos variables.

Dan información cualitativa

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qué indica un coeficiente de correlación r=1 o r=-1

A

Indican una perfecta relación positiva o negativa, según el caso.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Coeficiente de correlación de Pearson tiene una desventaja, cuál es y qué se rank se usa en su defecto

A

Refleja relaciones estrictamente lineales, y no siempre es el caso.

Un pequeño aumento en una variable puede tener un gran aumento en la dependiente. (estudiar nada a estudiar algo: mejora considerablemente la nota. Estudiar mucho a estudiar muchísimo más: la nota no mejora en esa cantidad de aumento)

Se usa el rank de Spearman

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Cuál es la formula que describe la regresión

A

y: es la variable dependiente
x: es la variable independiente.
bo: intercepto
b1: pendiente
e: son los residuales

y= bo+ b1X+e

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Un buen modelo de regresión lineal es aquel que…

A

El que tiene menor residuales.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Si los residuales son cero, cuál es el valor de R^2 y qué significa

A

R^2=1

Significa que no se cometieron errores al predecir los datos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Si el modelo realizado es una basura, qué valor de R^2 esperamos

A

R^2=0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Cuál es la formula de R^2

A

R^2=1-(SSres/SStot)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qué significa el R^2 ajustado

A

El R cuadrado ajustado (o coeficiente de determinación ajustado) se utiliza en la regresión múltiple para ver el grado de intensidad o efectividad que tienen las variables independientes en explicar la variable dependiente.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Cuál es la diferencia entre usar R cuadrado y R cuadrado ajustado

A

R cuadrado sirve para interpretar mejor.

Si te interesa corregir el bias, R cuadrado ajustado es the way to go

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Cuál es la hipótesis nula y alternativa de la regresión.

A

Prueba de hipótesis
nula: no hay relación entre variables, las independientes no explican la dependiente.

Alternativa: los datos se distribuyen exactamente como lo predice el modelo de la regresión.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qué significa si se obtienen valores grandes de F

A

Valores grandes de F indican que la hipótesis nula no está funcionando tan bien como la alternativa.