Regresión simple Flashcards
¿Qué representa b0 en el modelo de regresión lineal?
La intersección en el eje y
qué es lo que se realiza en un ANOVA en la regresión simple?
descomponer la variabilidad total (SST) en dos componentes principales:
Variabilidad explicada por el modelo (SSR): Es la parte de la variabilidad de y que se explica por la variable independiente x.
Variabilidad no explicada (SSE): Es la variabilidad que queda en los residuos.
para que se realiza un anova en la regresión simple?
El ANOVA evalúa si la relación entre x y y es significativa mediante una prueba F. Si el valor p de esta prueba es pequeño (<0.05), se concluye que x tiene un efecto significativo sobre y.
en la regresión simple, r^2 y R^2? es lo mismo?
En regresión lineal simple, solo hay una variable independiente (x).
El coeficiente de correlación (r) mide la fuerza y dirección de la relación lineal entre x y y. R^2 mide la proporción de variabilidad en y explicada por x. Como en regresión simple R^2=r^2, ambos conceptos coinciden numéricamente.
como se calcula r^2 en regresión simple
SSR/SST (variabilidad del modelo/ variabilidad total) ó 1 - (SSE/SST) (variabilidad no explicada por el modelo/varibilidad total)
si solo hay una variable en regresión simple, porque se ajusta la r^2
el ajuste tiene en cuenta el tamaño de la muestra (n) y el número de predictores (k=1).
1 - ((1- r^2)(n-1)/(n-2))
Diferencia entre nivel de significancia y nivel de confianza
significancia (alpha): error en rechazar la hipótesis nula cuando es verdadera.
confianza (1-alpha): porcentaje de certeza de que el parámetro poblacional (como la media) está dentro del intervalo de confianza calculado.
diferencia de un anova de regresion simple a uno de regresion múltiple
el ANOVA sigue el mismo principio, pero con solo una variable independiente. Solo cambia los grados de libertad, ya que en la regresión simple es uno solamente
Datos muestrales
(x testada (media), s (desviación estándar), s^2 (varianza), n (tamaño de la muestra)
Datos poblacionales
μ (miu, media), σ (sigma, desviacion estandar), σ^2 (sigma cuadrada, varianza), N (tamaño de la pobalción)
Elementos de la ecuación regresión simple
b1 (Coeficiente estimado muestral) impacto promedio de una unidad de cambio en x sobre y en los datos de la muestra (taza de cambio).
b0 (Intersección estimada muestral)
valor estimado del intercepto en la ecuación.
beta 1 (Coeficiente real poblacional)
Representan los verdaderos coeficientes que describen la relación entre x e y en toda la población.
Beta 0 (Intersección real poblacional)
valor verdadero del intercepto en la ecuación teórica de la población
cuando INV.T y cuando uso DIST
T.DIST:2C (como te pide un x (t), te da una probabilidad, aparte de que sus valores están entre 0-1) a mayor x menos grados, mejor valor
T.INV (te pide una probabilidad, por ejemplo, p-value o alpha)
que es ϵ
el error aleatorio o residuo.
(Solo en la poblacional), en la muestra se vuelve el error no explicado SSE (valor real vs. el predicho).
por que lo valores críticos piden una probabilidad
el valor critico toma como supuesto el valor de significancia
Para que se usa la prueba t
Determinar si un coeficiente de regresión es significativo.
Evaluar si una variable independiente tiene un efecto importante sobre la variable dependiente.
(Facilitar decisiones sobre qué variables incluir en un modelo).
Como se usa la prueba t
Determina el nivel de significancia y gl, calcula el valor crítico de t INV.T.2C(α ,gradosdelibertad) y compara el estadístico (Coeficiente b/Error estándar del coeficiente) con el critico
¿Cuál es la hipótesis nula (H0) en un modelo lineal?
Que el coeficiente de regresión (β) es igual a cero (β=0), lo que significa que la variable independiente no tiene un efecto significativo en y.
¿Cuál es la hipótesis alternativa (Ha) en un modelo lineal?
Que el coeficiente de regresión (β) es diferente de cero (β=0), lo que significa que la variable independiente tiene un efecto significativo en y.
¿Qué significa rechazar la hipótesis nula en un modelo lineal?
Significa que hay suficiente evidencia estadística para concluir que la variable independiente tiene un efecto significativo sobre y.
¿Qué significa no rechazar la hipótesis nula en un modelo lineal?
Significa que no hay suficiente evidencia estadística para concluir que la variable independiente afecta
y, aunque esto no prueba que β=0.
¿Qué se evalúa con el valor p en la prueba de hipótesis para un coeficiente?
Evalúa la probabilidad de observar un coeficiente tan extremo como el estimado, si la hipótesis nula (β=0) fuera verdadera.
¿Cómo se relaciona el estadístico t con la hipótesis nula en un modelo lineal?
El estadístico t mide cuántas desviaciones estándar está el coeficiente estimado (b) de cero. Un valor t grande (positivo o negativo) sugiere que el coeficiente es significativo.
¿Cómo se relacionan las hipótesis con el análisis F en el modelo lineal?
El análisis F prueba si el conjunto de predictores, en conjunto, explica significativamente la variabilidad en y.
region de rechazo en la H0
definida por el investigador o analista mediante la elección de un nivel de significancia (α) antes de realizar la prueba estadística.
estimación puntual
estimación que implica calcular un solo valor del parámetro para aproximar un parámetro desconocido de la población, como la media (μ) o un coeficiente de regresión (β).
estimación por intervalo
tipo de estimación que calcula un rango de valores dentro del cual se espera que se encuentre el parámetro desconocido de la población, con un nivel de confianza específico (por ejemplo, 95%).
¿Qué suposición verifica un gráfico de residuos vs. predicciones?
Verifica la homocedasticidad y la linealidad de la relación entre las variables.
¿Qué significa si los residuos en un gráfico de probabilidad normal no se alinean con la línea?
Indica que los residuos no siguen una distribución normal.
¿Cómo se relaciona el valor p con la prueba de hipótesis en regresión?
Si p<α, rechazamos H0, concluyendo que el coeficiente es significativo.
¿Qué es la regresión lineal multiple y cuál es su propósito principal?
La regresión lineal múltiple utiliza más de una variable independiente para predecir una variable dependiente, mientras que la simple solo utiliza una;