Probabilidade e Regressão Flashcards
Quais das afirmações abaixo sobre o Coeficiente de Determinação (R2) está correta?
a) É a percentagem da variação total de y explicada por x.
b) Nas regressões lineares múltiplas, o R2 é o quadrado do coeficiente de correlação.
c) É igual à soma dos quadrados total dividido pela soma dos quadrados da regressão.
d) Em uma regressão simples, o R2 pode ser calculado como a correlação dividida por n-1.
a) É a percentagem da variação total de y explicada por x.
O R2 é o percentual da variação total da variável dependente (y) que é explicada pela variável independente (x). Nas regressões lineares simples, o R2 é o quadrado do coeficiente de correlação. Nas regressões simples e múltiplas, é calculado pela divisão da soma dos quadrados da regressão pela soma dos quadrados total.
POWER SESSION
Uma analista de fundos está analisando o cenário para o próximo mês, ele deseja investir em um fundo de investimento que nos últimos 200 meses teve um retorno médio de 0,85% e uma variância de 0,25%. Qual o intervalo de confiança aproximado, com 5% de significância para o retorno do fundo no próximo mês? O Z-Score correspondente ao nível de significância de 5% é 1,96.
a) 0,36% a 1,34%.
b) 0,75% a 0,95%.
c) - 4,15% a 5,85%.
d) - 8,95% a 10,65%.
d) - 8,95% a 10,65%.
Temos que o retorno médio para o mês seguinte é dado pela fórmula 0,85%± 1,96√0,25%. Como foi dada a variância e não o desvio-padrão, temos que tirar a raiz de 0,25%. Nesse caso a resposta é 0,85%±1,965%; -8,95% a 10,65%.
Simulado 1
A equação que mais se aproxima nas vendas de um determinado produto num determinado ano é: Ln Vt = 0,6 + 0,9t. Qual é o valor previsto de vendas no ano de 2015, se para chegarmos a essa equação utilizamos o período de 2010 a 2014?
a) 6.
b) 16.
c) 130.
d) 403.
d) 403.
Como utilizamos o período de 2010 até 2014 para calibrar a equação temos que em 2010 (t = 1) e em 2014 (t = 5), nesse caso em 2015 (t = 6) a equação fica Ln Vt = 0,6 + 0,9*6 = 6 e Vt = e6 = 403
Simulado 1
Considere a seguinte equação e as informações sobre seus coeficientes.
Ln(x) = 0,10 + 0,5tamanho + 0,20 indexação:
Tabela 21
b t-estat -
intercepto 0,1 15,05
tamanho 0,5 3,87
indexação 0,2 1,95
Sobre os coeficientes, quais são estatisticamente significantes em um intervalo de confiança de 99%, considerando que a regressão abrangeu 200 observações:
a) Tamanho.
b) Tamanho e indexação.
c) Intercepto e indexação.
d) Intercepto e tamanho.
d) Intercepto e tamanho.
Quanto maior o grau de liberdade, que decorre do número de observações, mais a distribuição t de Student se aproxima da distribuição Normal. Ou seja, para 200 observações, o valor crítico t bicaudal de 99% de confiança, para 200 – 2 = 198 graus de liberdade é 2,58, valor bem próximo do valor z da distribuição normal para testes bicaudais. Em face das estatísticas dos testes t para o intercepto e tamanho serem superiores a 2,58, podemos concluir que estes coeficientes são significativamente diferentes de zero.
Simulado 1
Para se poder calcular se a média de QI dos empregados de uma organização é maior que 100, uma amostra de 30 empregados é tirada e o valor da amostra da estatística computado,
tn-1 = 1,2. Se você optar por um nível de significância de 5% você deve:
a) Rejeitar a hipótese nula e concluir que a média da população é maior que 100.
b) Não rejeitar a hipótese nula e concluir que a média da população não é maior que 100.
c) Não rejeitar a hipótese nula e concluir que a média da população é maior que 100.
d) Rejeitar a hipótese nula e concluir que a média da população é menor que 100.
b) Não rejeitar a hipótese nula e concluir que a média da população não é maior que 100.
A um nível de significância de 5%, a estatística t crítica usando a tabela de distribuição do Student t para um teste unicaudal e 29 graus de liberdade (tamanho da amostra de 30 menos 1) é 1.699 (com uma amostra grande a estatística z crítica de 1.645 pode ser usada). Porque a estatística t crítica é maior que a estatística t calculada, ou seja, a estatística t calculada não está na faixa de rejeição, nós não conseguimos rejeitar a hipótese nula e concluímos que a média da população não é muito maior que 100.
- Acho que está na Intervalo de confiança de média populacional da apostila, pg 16 da apostila digital. Mas não entendi a parte do z critico e z calculado.
Como não tem desvio padrão, to achando que ele me deu o tn que é 1,2, é só comparar com 1,699 ou 1,645
Por ele falar em t ele não indica que é graus de liberdade tambem?
Prova 1 - Probabilidades, Amostragem E Teste De Hipótese
O intervalo de confiança de 95% para uma população com uma média de 96 conhecidos, a variância de 9, e com 400 observações será:
a) 95.706 a 96.294.
b) 95.613 a 96.387.
c) 95.118 a 96.882.
d) 95.324 a 96.567.
a) 95.706 a 96.294.
Podemos calcular o desvio padrão da população, usamos a estatística-z. Um nível de confiança de 95% é calculado tomando a média da população e somando e subtraindo o produto de confiabilidade estatística-z (zα/2) fator vezes o desvio padrão conhecido da população dividida pela raiz quadrada do tamanho da amostra (note que a variância da população é dado e sua raiz quadrada positiva é o desvio padrão da população): x ± zα/2 × ( σ / n^1/2) = 96 ± 1.96 × (9^1/2 / 400^1/2) = 96 ± 1.96 × (0.15) = 96 ± 0.294 = 95.706 to 96.294.
- Intervalo de confiança de média populacional - pagina 16 da apostila digital e 68 da fisica
A variância nessa caso é da população, porque ela é conhecida.
Prova 1 - Probabilidades, Amostragem E Teste De Hipótese
Analise os resultados das regressões mensais de empréstimos imobiliários (RE) em bilhões de dólares pelos bancos comerciais no período de janeiro de 2010 a setembro de 2013 no quadro seguinte:
Resultados da Regressão de Séries Temporais para Empréstimos Imobiliários:
Modelo: REt = b0 + b1t + et = 1, 2, …, 45
Gráfico / Imagem 4
A intersecção e coeficiente de inclinação são significativamente diferentes de zero no nível de 5%?
a) Ambos são estatisticamente significantes.
b) Apenas o b0 é estatisticamente significante.
c) Apenas o b1 é estatisticamente significante.
d) Nenhum deles é estatisticamente significante.
a) Ambos são estatisticamente significantes.
A estatística-t testa a significância estatística da intersecção e do coeficiente angular é a estimativa do parâmetro dividido pelo seu erro padrão. Nós rejeitamos a hipótese nula e concluímos que os coeficientes são estatisticamente significativos se o valor absoluto da estatística-t for maior que o bicaudal de 5% ao valor crítico t com 43 graus de liberdade, que é 2.02. tb0 = 1.195,6241/ 8,9704362 = 133,3 tb1 = 12.230448/0,3396717 = 36,0 Ambos a intersecção e o coeficiente de inclinação são significativamente diferentes de zero para o nível de 5%, porque ambas estatísticas-t são maiores do que o valor crítico t de 2,02.
- Pg95 na apostila fisica
Prova 1 - Probabilidades, Amostragem E Teste De Hipótese
O Coeficiente de Determinação é uma medida estatística que recai no seguinte intervalo:
a) (0, 1).
b) (-1, 0).
c) (-1, +1).
d) (-infinito, +infinito).
a) (0, 1).
O Coeficiente de Determinação (R2) é um número que recai no intervalo entre 0 e 1, sendo definido como a percentagem da variação total da variável dependente que é explicada pela variável independente.
Prova 1 - Regressão E Séries Temporais
Apresenta-se a seguir o resumo dos resultados de uma regressão linear simples, onde o retorno mensal de determinada ação é a variável dependente e o retorno mensal do índice de mercado é a variável independente:
Tabela 24
Analisando as informações, pode-se deduzir que:
a) Os retornos da ação e do índice são negativamente correlacionados.
b) Mais que 95% das variações dos retornos não são explicadas pela regressão.
c) Um aumento de 1% no índice resulta em um decréscimo de 0,4563% no preço da ação.
d) Um aumento de 1% no preço da ação impacta o positivamente o índice em 0,1657%.
b) Mais que 95% das variações dos retornos não são explicadas pela regressão.
O R-Quadrado ou Coeficiente de Determinação é o percentual da variação total da variável dependente que é explicada pela variável independente. No exemplo, o R-Quadrado de 0,024 indica que a variação do índice explica apenas 2,4% da variação do preço da ação. Ou seja, mais que 95% das variações dos retornos não são explicadas pela regressão. Por sua vez, o coeficiente da intersecção de -0,456285731 significa que, quando o retorno do índice é zero, o retorno da ação é - 0,45%. Já o coeficiente da inclinação da variável X1, no exemplo de 0,165683693, além de evidenciar que uma correção positiva entre os retornos, pode ter a seguinte intepretação: Um aumento de 1% no índice impacta positivamente o preço da ação em 0,1657%.
Um investidor gostaria de ter uma dimensão de intervalo de performance do seu portfólio no período de um ano. Sabendo que a performance esperada e o desvio do portfólio são 10% e 5% ao ano respectivamente, qual é o intervalo de confiança dos retornos do portfólio em um ano com 95% de confiança:
Alpha 1% - z= 2,58
Alpha 5% - z= 2,00
Alpha 10% - z= 1,65
a) [1,75% ; 18,25%]
b) [-2,90%; 22,90%]
c) [0,0% ; 20,0%]
d) [-5,0%; 25%]
c) [0,0% ; 20,0%]
Intervalo de confiança de 95% requer uma significância (alpha) de 5%, logo o intervalo de confiança da carteira será : retorno+- z* desvio 10%+- 2,00* 5%
Simulado 2
Um gerente do Departamento de Recursos Naturais de um determinado lago, é responsável por determinar seus limites de pesca. Nos últimos dois meses ele tirou amostras para determinar se a média de comprimento dos peixes nesse lago excede 18 polegadas (usando um nível de significância de 0,05). Assuma que o valor p é 0,08. Quando ele conclui que a média de tamanho do peixe excede 18 polegadas, ele:
a) Comete um erro tipo II.
b) Está correto.
c) Comete um erro tipo I.
d) Comete um erro tipo I e tipo II.
c) Comete um erro tipo I.
Isso é um exemplo de um erro Tipo I, ou rejeição de uma hipótese quando ela é realmente verdadeira (também conhecido como nível de significância do teste). Aqui, Ho: μ = 18 polegadas e Ha: μ > 18 polegadas. Quando o valor p é maior que o nível de significância (0.08 > 0.05), nós não conseguimos rejeitar a hipótese nula. Como Jacobi rejeitou Ho quando era verdadeiro, ele cometeu um erro Tipo I. As outras afirmações estão erradas. Erro Tipo II ocorre quando você não rejeita uma hipótese quando ela é falsa (também conhecido como força do teste). Não é possível cometer um erro tipo I e II ao mesmo tempo.
- Tem que ver de novo a apostila, porque esse negócio nao está fazendo sentido para mim.
Prova 1 - Probabilidades, Amostragem E Teste De Hipótese
Considere a seguinte regressão:
Vendasi = 10,0 + 1,25 R&Di + 1,0 ADVi - 2,0 COMPi + 8,0 CAPi
Onde Vendas são em milhões, Research & Development (R&D) são os gastos de pesquisa e desenvolvimento em milhões, ADV é o valor gasto em propaganda em milhões, COMP é o número de concorrentes na indústria, e CAP são os gastos de capital para o período em milhões. A interpretação correta dessa informação é que:
a) Se a companhia gastar $1 milhão em capital (mantendo todo o resto constante), é esperado que as vendas subam $ 18,0 milhões.
b) Um competidor a mais significará $ 2 milhões a menos em vendas (mantendo o resto constante).
c) Se os gastos com R&D e propaganda são $1 milhão cada, há 5 concorrentes, e gastos com capital são $2 milhões, as vendas esperadas serão $ 8,5 milhões.
d) Se a companhia gastar $1 milhão em pesquisa e desenvolvimento, é esperado que as vendas subam $ 1,25 milhões.
b) Um competidor a mais significará $ 2 milhões a menos em vendas (mantendo o resto constante).
A alternativa B está correta pois dado tudo constante, o aumento de 1 unidade da variável independente concorrentes, impactará exatamente em perda de 2 milhões de vendas. Na alternativa A o valor de aumento está incorreto pois se mantivermos tudo constante a diferença nas vendas são 8 milhões. A alternativa D está incorreta pois não afirma nada sobre o nível das outras variáveis. A alternativa C está incorreta: Vendas previstas = $10 + 1,25 + 1 – 10 + 16 = $18,25 milhões.
- Quero achar esse exercicio na apostila.
Prova 1 - Regressão E Séries Temporais
Um gestor escolhe o IBX como benchmark de sua carteira e contrata hedge para eliminar o risco cambial. Como parte de suas pesquisas, testa a hipótese de que o excesso de retorno de sua carteira pode ser explicado pela seguinte regressão:
Retorno da Carteira – Taxa Livre de Risco = α + b1IBX + b2Cambio + ε, onde α = 0,5, b1 = 1 e b2 = 0.
Durante a fase do feedback, o gestor constatou um baixo percentual da variação total do excesso de retorno de sua carteira explicado pelas variáveis independentes. Qual a mais evidente limitação da regressão formulada pelo gestor?
a) Valor esperado do resíduo não é zero.
b) Resíduo não é normalmente distribuído.
c) Variável dependente não está linearmente relacionada com cada uma das variáveis independentes.
d) Variável independente é correlacionada com os resíduos.
c) Variável dependente não está linearmente relacionada com cada uma das variáveis independentes.
Ao contratar o hedge e verificar que b2 = 0, o gestor não deveria considerar na regressão o câmbio como variável independente, pois não há um relacionamento linear deste com a variável dependente, ou seja, com o excesso de retorno de sua carteira. Os dados fornecidos no enunciado não são suficientes para a análise dos demais pressupostos.
Prova 1 - Regressão E Séries Temporais
A média de idade de uma população é igual a 35 e a média de idade de uma amostra de tamanho 64 é igual a 36. Sendo a variância da amostra igual a 16, o erro padrão da média amostral é aproximadamente:
a) 0,50
b) 0,75
c) 1,00
d) 2,00
a) 0,50
o erro padrão da média amostral deve ser estimado pela divisão do desvio padrão da média amostral (s) por √n. Sendo assim e considerando que o enunciado informou a variância da amostra, e não o seu desvio padrão, temos: Erro padrão da média amostral = √16 / √64 = 4 / 8 = 0,50
Prova 1 - Probabilidades, Amostragem E Teste De Hipótese
Um fundo que exibe uma distribuição normal em seus retornos e cuja média é de 0,4% a.m., com desvio padrão (DP) de 0,05%, expressa uma probabilidade de apresentar um retorno de 0,6% em determinado mês mais próxima de:
a) zero.
b) 1%.
c) 5%.
d) 10%.
a) zero.
Com três DP, temos 99,73% das observações contidas dentro da área sob a curva normal. Sendo assim, a probabilidade do fundo apresentar um retorno superior a três DP distante de sua média, ou seja, maior que 0,4% + (3 x 0,05%) = 5,5%, é inferior a 0,27%.
Simulado 2
Qual o Coeficiente de Correlação de uma regressão linear com duas variáveis independentes, cujo modelo evidencia que 80% da variação da variável dependente é explicada pela primeira variável independente?
a) 0,75.
b) 0,80.
c) 0,89.
d) Não pode ser calculado com as informações disponíveis.
d) Não pode ser calculado com as informações disponíveis.
Em regressões lineares simples, isto é, aquelas com apenas uma variável independente, o coeficiente de determinação R2 pode ser computado elevando ao quadrado o coeficiente de correlação (r). Entretanto, esta relação não é válida quando mais de uma variável independente é utilizada na regressão, o que é o caso da regressão linear múltipla. Neste caso, o R2 pode ser calculado através da Tabela ANOVA.
Prova 1 - Regressão E Séries Temporais
É considerada uma violação que não causa a menor consequência para um Regressão:
a) Heterocedasticidade não condicional.
b) Heterocedasticidade condicionada.
c) Auto correlação positiva.
d) Multicolinearidade.
a) Heterocedasticidade não condicional.
A Heterocedasticidade ocorre quando a variância dos resíduos não é a mesma entre todas as observações abrangidas na análise. A Heterocedasticidade é não condicional quando não está relacionada com o nível da variável independente, o que não causa maiores consequências para a regressão. Um problema é quando constatada uma Heterocedasticidade condicionada ao nível da variável independente, pois neste caso, as estimativas de erro padrão não são confiáveis. A auto correlação positiva existe quando o erro positivo de um período aumenta a probabilidade de observarmos um erro positivo no período subsequente. o efeito da correlação positiva é um menor erro padrão, o que gera uma maior incidência de erros Tipo I, ou seja, o de rejeitarmos a hipótese nula quando ela é verdadeira. A Multicolinearidade se refere a uma situação onde duas ou mais variáveis independentes em uma regressão múltipla são altamente correlacionadas uma com a outra. Esta condição distorce o erro padrão da estimativa e dos coeficientes, levando a problemas na condução dos testes t para avaliação dos parâmetros de significância.
Prova 1 - Regressão E Séries Temporais
Uma analista de ações está avaliando a variação das vendas da indústria XYZ. Tendo uma amostra de 100 dias, ela calculou que a média de vendas diária é R$ 120.000,00, e o desvio padrão é de R$ 2.500,00. Qual o intervalo de confiança, com 5% de significância? O Z-Score correspondente ao nível de significância de 5% é 1,96.
a) R$ 119.500 a R$ 120.500.
b) R$ 115.200 a R$ 125.300.
c) R$ 112.800 a R$ 138.100.
d) R$ 118.700 a R$ 122.500.
a) R$ 119.500 a R$ 120.500.
Da teoria de estatística, sabemos que se a distribuição amostral de médias amostrais é uma distribuição normal. O intervalo de confiança é igual a 120± 1,96*2,5/√100 = 119,5 a 120,5
Simulado 3
Dada a equação de previsão: xt = 5 + 1,75 xt-1, qual é o valor previsto de xt+2 se xt-1 é 16,5?
a) 33,87
b) 64,28
c) 117,49
d) 210,61
c) 117,49
Dado xt–1 = 16,5, xt= 5 + 1,75(16.5) = 33,875. Então, xt+1= 5 + 1,75xt = 5 + 1,75(33,875) = 64,28. Então, xt+2= 5 + 1,75xt = 5 + 1,75(64,28) = 117,49.
Simulado 3
A partir de uma amostra de 64 debêntures high-yield um gestor encontrou um retorno médio 14% e um desvio padrão de 25%. A inferência estatística válida para esses retornos seria que o verdadeiro retorno da população está entre:
a) 7,8% e 20,1%, com 95% de confiança.
b) 7,0% e 21,0%, com 95% de confiança.
c) 6,5% e 22,3%, com 90% de confiança.
d) 4,1% e 23,9%, com 99% de confiança.
a) 7,8% e 20,1%, com 95% de confiança.
Inferência estatística significa estimar qual é a verdadeira média da população, sem conhecê-la. Se queremos 95% de confiança nessa estimativa, usamos um z-crítico de 1.96. Se queremos 90% de confiança, usamos um z-crítico de 1.64 e se queremos 99% de confiança, usamos um z-crítico de 2.58. Com 95% de confiança, por exemplo, ela estaria no intervalo 14%1.96 * 25%/√64 = 7,88%≤Ret≤20.13. Com 90% confiança estaria entre 8.875% e 19.125%. Com 99% confiança estaria entre 5.937% e 22.06%. A única alternativa que mostra um intervalo aceitável é A.
- Ainda não entendi bem pq isso aqui é inferência de confiança de média populacional com variância conhecida.
Tem que decorar tambem o 90%, 95% e 99%.
Prova 1 - Probabilidades, Amostragem E Teste De Hipótese