Correlation & Regression Flashcards
Qué presupuestos tiene la regresión lineal
- Linealidad: se prueba con gráficos de dispersión.
En la distribución de residuos se debe mostrar:
- Normalidad: se prueba con el gráfico QQ
- Homogeneidad de la varianza
- Independencia
- Falta de colinealidad : se prueba con la variance inflation factor
qué significa la falta de colinealidad y para qué importa en la regresión
No se quiere que los predictores tengan una correlación fuerte entre ellos. Que la tengan puede causar problemas evaluando el modelo.
Cuáles son las diferencias del error estándar de la regresión
El error estándar del coeficiente de regresión depende de las variables (ambas: independientes y dependientes) y es sensitivo a violaciones de la homogeneidad de las varianzas.
La correlación y la regresión lineal qué miden o qué tienen en común
Ambas describen la relación entre variables
Para qué sirven los scatterplots (diagramas de dispersión)
Dan una idea general de qué tan cercana es la relación entre dos variables.
Dan información cualitativa
Qué indica un coeficiente de correlación r=1 o r=-1
Indican una perfecta relación positiva o negativa, según el caso.
Coeficiente de correlación de Pearson tiene una desventaja, cuál es y qué se rank se usa en su defecto
Refleja relaciones estrictamente lineales, y no siempre es el caso.
Un pequeño aumento en una variable puede tener un gran aumento en la dependiente. (estudiar nada a estudiar algo: mejora considerablemente la nota. Estudiar mucho a estudiar muchísimo más: la nota no mejora en esa cantidad de aumento)
Se usa el rank de Spearman
Cuál es la formula que describe la regresión
y: es la variable dependiente
x: es la variable independiente.
bo: intercepto
b1: pendiente
e: son los residuales
y= bo+ b1X+e
Un buen modelo de regresión lineal es aquel que…
El que tiene menor residuales.
Si los residuales son cero, cuál es el valor de R^2 y qué significa
R^2=1
Significa que no se cometieron errores al predecir los datos.
Si el modelo realizado es una basura, qué valor de R^2 esperamos
R^2=0
Cuál es la formula de R^2
R^2=1-(SSres/SStot)
Qué significa el R^2 ajustado
El R cuadrado ajustado (o coeficiente de determinación ajustado) se utiliza en la regresión múltiple para ver el grado de intensidad o efectividad que tienen las variables independientes en explicar la variable dependiente.
Cuál es la diferencia entre usar R cuadrado y R cuadrado ajustado
R cuadrado sirve para interpretar mejor.
Si te interesa corregir el bias, R cuadrado ajustado es the way to go
Cuál es la hipótesis nula y alternativa de la regresión.
Prueba de hipótesis
nula: no hay relación entre variables, las independientes no explican la dependiente.
Alternativa: los datos se distribuyen exactamente como lo predice el modelo de la regresión.