Regresión Flashcards
Repaso conceptos generales
En una regresión lineal, con qué datos se estiman los parámetros?
datos de entrenamiento , con eso saco y gorro (estimado)
A qué es igual el residual de i?
ei= yi- yi estimado, la diferencia entre la observada y la predicha
los coeficientes tienen como objetivo minimizar…?
la suma residual de cuadrados (RSS)
Qué es el intercepto en una regresión lineal?
es el esperado de Y
el modelo de f es la linea…
de regresión poblacional
la estimación del modelo f se realiza por medio de
la línea de mínimos cuadrados
Cómo sé si un estimador es insesgado?
si el valor esperado de mi estimador es igual al parámetro
Si bien el valor esperado del estimador insesgado tiende a converger con el parámetro objetivo este puede estar lejos del valor real. Esto cómo se mide?
Con el error estándar del estimado
las fórmulas de los estimativos de errores estándar requieren dos supuestos:
- independencia
- misma desviación estándar
Error estándar residual
sqrt( RSS / (n-2) ), es la misma desviación estándar de los errores
para medir la presición de los estimadores se usan
pruebas de hipótesis de significancia individual
si la prueba de hipotesis de significancia individual para una única variable da un p valor de 0.002 que pasa con el modelo?
a un nivel de significancia del 0.05 no hay evidencia suficiente para rechazar la nula, es decir el modelo se reduce al modelo nulo
Con que estadístico se mide la presición de los estimadores?
una prueba t
Si no hay relación entre X y Y entonces el estadístico va a seguir una distribución…
t con n-2 grados de libertad
Cómo se cuantifica el ajuste del modelo a los datos?
R cuadrado y con el error estándar residual (RSE)
qué es el RSE
es un estimativo de la desviación estándar del error,
irreducible. Es el valor promedio que en que la respuesta se desviará
de la línea de regresión verdadera.
el R cuadrado para una regresión simple es igual a …
la correlación
En una regresión linela múltiple cómo se evalua la presición de los betas estimados?
prueba de significancia global con una prueba F
Los valores 𝑝 de cada variable …
reportan el efecto parcial de incluir
cada variable al modelo
criterios para la selección de variables:
- criterio de información de Akaike (AIC)
- criterio de información Bayesiano (BIC)
- R ^2 ajustado
metodologías para la selección de variables
- forward
-backward
-mixed
En qué consiste el método de selección Forward?
se comienza con el modelo nulo, se ajustan 𝑝
regresiones lineales simples y se adjunta el predictor con el menor 𝑅𝑆𝑆.
Se sigue hasta que se alcanza una regla de parada.
En qué consiste el método de selección Backward?
se comienza con el modelo que incluye todas las
variables, y se elimina la variable con el mayor valor 𝑝 y así
sucesivamente hasta que se alcanza una regla de parada.
En qué consiste el método de selección mixed?
se combinan las técnicas anteriores, se comienza con
el modelo nulo y se adiciona una variable, si en algún momento del
procedimiento el valor 𝑝 de alguna variable sube por encima de un
valor específico se elimina esta variable del modelo.
Qué problema tiene estimar por MCO una respuesta cualitativa o categórica?
- discretitud
- acotamiento
- heterocedasticidad
Para modelar estas variables categóricas se usa…
modelos no lineales, como el logit y el probit
Estos modelos no lineales que estiman?
la probabilidad de que suceda cada categoría dados los predictores
En el modelo logit cómo se estiman los coeficientes?
por máxima verosimilitud
Cuando se tiene una regresión multinomial (que la variable de respuesta tiene as de dos clases ) cómo se estima el modelo?
se escoje una variable base y de ahí parte mi probabilidad condicional