2.5 Regressão Linear Flashcards
Em Matéria de Estatística, quanto à Regressão Linear,
A fórmula da regressão linear é tipicamente descrita como Y = a + bx + 𝜀
1) Como encontrar o parâmetro b? Qual é a fórmula que o identifica?
2) E quando o intertecpto (a) for igual a zero, que outra fórmula podemos usar para encontrar o parâmetro b?
1) O parâmetro b é a razão entre a covariância de X e Y sobre a variância de X
b = covariância (X, Y) / variância (X)
2) Quando o intercepto a for igual a zero, então o parâmetro b pode ser encontrado pela razão entre a média do produto de X por Y dividido pela média dos quadrados de X
b = E[XY] / E[X²]
Em Matéria de Estatística, quanto à Regressão Linear,
A fórmula da regressão linear é tipicamente descrita como Y = a + bx + 𝜀
Dentre as variáveis X e Y, qual é a explicativa e qual é a dependente?
X é a explicativa
Y é a dependente
Pois X explica a variável Y. À medida que X varia, isto buscará explicar os movimentos de Y
Em Matéria de Estatística, quanto à Regressão Linear,
Sempre bom refrescar: como se calcula a correlação (x,y)?
correlação (x,y) = covariância (x,y) / σx * σy
Em Matéria de Estatística, quanto à Regressão Linear,
Tipicamente, a média do Erro Amostral (𝜀) é ____ (igual / diferente) de zero
Igual a zero
Tipicamente, a média do Erro Amostral (𝜀) é igual a zero. Pois se for diferente de zero, significa que o modelo precisa ser ajustado.
Exemplo: se tipicamente meu modelo erra uma unidade para cima, significa que preciso ajustá-lo, como um todo, uma unidade para cima na parte do a + bX
Em Matéria de Estatística, quanto à Regressão Linear,
De modo bem simples, o que é a Análise dos Resíduos?
A Análise dos Resíduos estuda as diferenças entre o valor correto da variável Y e o valor estimado dela pela fórmula de regressão linear. É o quanto o parâmetro real se desvia do valor estimado.
Em Matéria de Estatística, quanto à Regressão Linear,
1) Como se calcula o Coeficiente de Determinação (R²) pela Correlação?
2) Como se calcula o Coeficiente de Determinação (R²) pelo método da Soma dos Quadrados (SQ)?
1) O Coeficiente de Determinação (R²) é igual ao quadrado da correlação
R² = ρ²
2) No método dos quadrados, temos que o Coeficiente de Determinação (R²) é igual à razão entre a Soma dos Quadrados da Regressiva (SQReg) sobre a Soma dos Quadrados Totais (SQTot)
R² = SQReg/SQTot
Lembrando que a Soma dos Quadrados Totais (SQTot) é igual à soma dos Quadrados da Regressiva (SQReg) mais a Soma dos Quadrados dos Erros (SQEr). Portanto, poderíamos também escrever que
R² = SQReg / (SQReg + SQEr)
Em Matéria de Estatística, quanto à Regressão Linear,
Como podemos interpretar o valor do Coeficiente de Determinação (R²), dentre os vários valores que ele pode assumir?
R² = 1 → significa que ele explica todas as variabilidades de dados e portanto os valores encontram-se em cima da reta de mínimos quadrados
R² = 0 → significa que ele não explica nenhuma das variabilidades de dados e portanto os valores não se encontram em cima da reta de mínimos quadrados
R² próximo de 1 → significa que ele explica a maior parte das variabilidades de dados e portanto os valores encontram-se próximos da reta de mínimos quadrados
R² próximo de zero → significa que ele não explica a maioria das variabilidades de dados e portanto os valores não se encontram próximos da reta de mínimos quadrados
Em Matéria de Estatística, quanto à Regressão Linear,
Al\gumas questões assustam no enunciado, mas é simples de resolvê-las se souber algumas fórmulinhas simples.
Dito isto, alguns Graus de Liberdade (GL) são importantes de conhecermos. Como se dá os graus de liberdade
1) Total
2) Modelo (ou Fator)
3) Erro
1) Total = N – 1. Ou seja, é o número de observações menos 1
2) Modelo (ou Fator) = p – 1. Ou seja, é o número de variáveis (ou parâmetros) menos 1
3) Erro = N – p. Ou seja, é o número de observações menos o número de variáveis (ou parâmetros).
Também podemos dizer que o GLtotal = GLfator + GLerro
Em Matéria de Estatística, quanto à Regressão Linear,
Como se calcula a estatística F? Não tem jeito, tem de decorar
F = (SQReg / (p-1)) / (SQEr / (N-p))
É a Soma dos Quadrados da Regressiva (SQReg) dividido por (p-1), em que p é o número de parâmetros. E daí tudo isto dividido pela Soma dos Quadrados do Erro sobre N-p, em que N é o número total de observações.