Probabilidade e Regressão Flashcards

1
Q

Quais das afirmações abaixo sobre o Coeficiente de Determinação (R2) está correta?

a) É a percentagem da variação total de y explicada por x.
b) Nas regressões lineares múltiplas, o R2 é o quadrado do coeficiente de correlação.
c) É igual à soma dos quadrados total dividido pela soma dos quadrados da regressão.
d) Em uma regressão simples, o R2 pode ser calculado como a correlação dividida por n-1.

A

a) É a percentagem da variação total de y explicada por x.

O R2 é o percentual da variação total da variável dependente (y) que é explicada pela variável independente (x). Nas regressões lineares simples, o R2 é o quadrado do coeficiente de correlação. Nas regressões simples e múltiplas, é calculado pela divisão da soma dos quadrados da regressão pela soma dos quadrados total.

POWER SESSION

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Uma analista de fundos está analisando o cenário para o próximo mês, ele deseja investir em um fundo de investimento que nos últimos 200 meses teve um retorno médio de 0,85% e uma variância de 0,25%. Qual o intervalo de confiança aproximado, com 5% de significância para o retorno do fundo no próximo mês? O Z-Score correspondente ao nível de significância de 5% é 1,96.

a) 0,36% a 1,34%.
b) 0,75% a 0,95%.
c) - 4,15% a 5,85%.
d) - 8,95% a 10,65%.

A

d) - 8,95% a 10,65%.

Temos que o retorno médio para o mês seguinte é dado pela fórmula 0,85%± 1,96√0,25%. Como foi dada a variância e não o desvio-padrão, temos que tirar a raiz de 0,25%. Nesse caso a resposta é 0,85%±1,965%; -8,95% a 10,65%.

Simulado 1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

A equação que mais se aproxima nas vendas de um determinado produto num determinado ano é: Ln Vt = 0,6 + 0,9t. Qual é o valor previsto de vendas no ano de 2015, se para chegarmos a essa equação utilizamos o período de 2010 a 2014?

a) 6.
b) 16.
c) 130.
d) 403.

A

d) 403.

Como utilizamos o período de 2010 até 2014 para calibrar a equação temos que em 2010 (t = 1) e em 2014 (t = 5), nesse caso em 2015 (t = 6) a equação fica Ln Vt = 0,6 + 0,9*6 = 6 e Vt = e6 = 403

Simulado 1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Considere a seguinte equação e as informações sobre seus coeficientes.
Ln(x) = 0,10 + 0,5tamanho + 0,20 indexação:

Tabela 21

b t-estat -
intercepto 0,1 15,05
tamanho 0,5 3,87
indexação 0,2 1,95

Sobre os coeficientes, quais são estatisticamente significantes em um intervalo de confiança de 99%, considerando que a regressão abrangeu 200 observações:

a) Tamanho.
b) Tamanho e indexação.
c) Intercepto e indexação.
d) Intercepto e tamanho.

A

d) Intercepto e tamanho.

Quanto maior o grau de liberdade, que decorre do número de observações, mais a distribuição t de Student se aproxima da distribuição Normal. Ou seja, para 200 observações, o valor crítico t bicaudal de 99% de confiança, para 200 – 2 = 198 graus de liberdade é 2,58, valor bem próximo do valor z da distribuição normal para testes bicaudais. Em face das estatísticas dos testes t para o intercepto e tamanho serem superiores a 2,58, podemos concluir que estes coeficientes são significativamente diferentes de zero.

Simulado 1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Para se poder calcular se a média de QI dos empregados de uma organização é maior que 100, uma amostra de 30 empregados é tirada e o valor da amostra da estatística computado,

tn-1 = 1,2. Se você optar por um nível de significância de 5% você deve:

a) Rejeitar a hipótese nula e concluir que a média da população é maior que 100.
b) Não rejeitar a hipótese nula e concluir que a média da população não é maior que 100.
c) Não rejeitar a hipótese nula e concluir que a média da população é maior que 100.
d) Rejeitar a hipótese nula e concluir que a média da população é menor que 100.

A

b) Não rejeitar a hipótese nula e concluir que a média da população não é maior que 100.

A um nível de significância de 5%, a estatística t crítica usando a tabela de distribuição do Student t para um teste unicaudal e 29 graus de liberdade (tamanho da amostra de 30 menos 1) é 1.699 (com uma amostra grande a estatística z crítica de 1.645 pode ser usada). Porque a estatística t crítica é maior que a estatística t calculada, ou seja, a estatística t calculada não está na faixa de rejeição, nós não conseguimos rejeitar a hipótese nula e concluímos que a média da população não é muito maior que 100.

  • Acho que está na Intervalo de confiança de média populacional da apostila, pg 16 da apostila digital. Mas não entendi a parte do z critico e z calculado.
    Como não tem desvio padrão, to achando que ele me deu o tn que é 1,2, é só comparar com 1,699 ou 1,645
    Por ele falar em t ele não indica que é graus de liberdade tambem?

Prova 1 - Probabilidades, Amostragem E Teste De Hipótese

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

O intervalo de confiança de 95% para uma população com uma média de 96 conhecidos, a variância de 9, e com 400 observações será:

a) 95.706 a 96.294.
b) 95.613 a 96.387.
c) 95.118 a 96.882.
d) 95.324 a 96.567.

A

a) 95.706 a 96.294.

Podemos calcular o desvio padrão da população, usamos a estatística-z. Um nível de confiança de 95% é calculado tomando a média da população e somando e subtraindo o produto de confiabilidade estatística-z (zα/2) fator vezes o desvio padrão conhecido da população dividida pela raiz quadrada do tamanho da amostra (note que a variância da população é dado e sua raiz quadrada positiva é o desvio padrão da população): x ± zα/2 × ( σ / n^1/2) = 96 ± 1.96 × (9^1/2 / 400^1/2) = 96 ± 1.96 × (0.15) = 96 ± 0.294 = 95.706 to 96.294.

  • Intervalo de confiança de média populacional - pagina 16 da apostila digital e 68 da fisica
    A variância nessa caso é da população, porque ela é conhecida.

Prova 1 - Probabilidades, Amostragem E Teste De Hipótese

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Analise os resultados das regressões mensais de empréstimos imobiliários (RE) em bilhões de dólares pelos bancos comerciais no período de janeiro de 2010 a setembro de 2013 no quadro seguinte:

Resultados da Regressão de Séries Temporais para Empréstimos Imobiliários:

Modelo: REt = b0 + b1t + et = 1, 2, …, 45

Gráfico / Imagem 4

A intersecção e coeficiente de inclinação são significativamente diferentes de zero no nível de 5%?

a) Ambos são estatisticamente significantes.
b) Apenas o b0 é estatisticamente significante.
c) Apenas o b1 é estatisticamente significante.
d) Nenhum deles é estatisticamente significante.

A

a) Ambos são estatisticamente significantes.

A estatística-t testa a significância estatística da intersecção e do coeficiente angular é a estimativa do parâmetro dividido pelo seu erro padrão. Nós rejeitamos a hipótese nula e concluímos que os coeficientes são estatisticamente significativos se o valor absoluto da estatística-t for maior que o bicaudal de 5% ao valor crítico t com 43 graus de liberdade, que é 2.02. tb0 = 1.195,6241/ 8,9704362 = 133,3 tb1 = 12.230448/0,3396717 = 36,0 Ambos a intersecção e o coeficiente de inclinação são significativamente diferentes de zero para o nível de 5%, porque ambas estatísticas-t são maiores do que o valor crítico t de 2,02.

  • Pg95 na apostila fisica

Prova 1 - Probabilidades, Amostragem E Teste De Hipótese

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

O Coeficiente de Determinação é uma medida estatística que recai no seguinte intervalo:

a) (0, 1).
b) (-1, 0).
c) (-1, +1).
d) (-infinito, +infinito).

A

a) (0, 1).

O Coeficiente de Determinação (R2) é um número que recai no intervalo entre 0 e 1, sendo definido como a percentagem da variação total da variável dependente que é explicada pela variável independente.

Prova 1 - Regressão E Séries Temporais

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Apresenta-se a seguir o resumo dos resultados de uma regressão linear simples, onde o retorno mensal de determinada ação é a variável dependente e o retorno mensal do índice de mercado é a variável independente:

Tabela 24

Analisando as informações, pode-se deduzir que:

a) Os retornos da ação e do índice são negativamente correlacionados.
b) Mais que 95% das variações dos retornos não são explicadas pela regressão.
c) Um aumento de 1% no índice resulta em um decréscimo de 0,4563% no preço da ação.
d) Um aumento de 1% no preço da ação impacta o positivamente o índice em 0,1657%.

A

b) Mais que 95% das variações dos retornos não são explicadas pela regressão.

O R-Quadrado ou Coeficiente de Determinação é o percentual da variação total da variável dependente que é explicada pela variável independente. No exemplo, o R-Quadrado de 0,024 indica que a variação do índice explica apenas 2,4% da variação do preço da ação. Ou seja, mais que 95% das variações dos retornos não são explicadas pela regressão. Por sua vez, o coeficiente da intersecção de -0,456285731 significa que, quando o retorno do índice é zero, o retorno da ação é - 0,45%. Já o coeficiente da inclinação da variável X1, no exemplo de 0,165683693, além de evidenciar que uma correção positiva entre os retornos, pode ter a seguinte intepretação: Um aumento de 1% no índice impacta positivamente o preço da ação em 0,1657%.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Um investidor gostaria de ter uma dimensão de intervalo de performance do seu portfólio no período de um ano. Sabendo que a performance esperada e o desvio do portfólio são 10% e 5% ao ano respectivamente, qual é o intervalo de confiança dos retornos do portfólio em um ano com 95% de confiança:

Alpha 1% - z= 2,58
Alpha 5% - z= 2,00
Alpha 10% - z= 1,65

a) [1,75% ; 18,25%]
b) [-2,90%; 22,90%]
c) [0,0% ; 20,0%]
d) [-5,0%; 25%]

A

c) [0,0% ; 20,0%]

Intervalo de confiança de 95% requer uma significância (alpha) de 5%, logo o intervalo de confiança da carteira será : retorno+- z* desvio 10%+- 2,00* 5%

Simulado 2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Um gerente do Departamento de Recursos Naturais de um determinado lago, é responsável por determinar seus limites de pesca. Nos últimos dois meses ele tirou amostras para determinar se a média de comprimento dos peixes nesse lago excede 18 polegadas (usando um nível de significância de 0,05). Assuma que o valor p é 0,08. Quando ele conclui que a média de tamanho do peixe excede 18 polegadas, ele:

a) Comete um erro tipo II.
b) Está correto.
c) Comete um erro tipo I.
d) Comete um erro tipo I e tipo II.

A

c) Comete um erro tipo I.

Isso é um exemplo de um erro Tipo I, ou rejeição de uma hipótese quando ela é realmente verdadeira (também conhecido como nível de significância do teste). Aqui, Ho: μ = 18 polegadas e Ha: μ > 18 polegadas. Quando o valor p é maior que o nível de significância (0.08 > 0.05), nós não conseguimos rejeitar a hipótese nula. Como Jacobi rejeitou Ho quando era verdadeiro, ele cometeu um erro Tipo I. As outras afirmações estão erradas. Erro Tipo II ocorre quando você não rejeita uma hipótese quando ela é falsa (também conhecido como força do teste). Não é possível cometer um erro tipo I e II ao mesmo tempo.

  • Tem que ver de novo a apostila, porque esse negócio nao está fazendo sentido para mim.

Prova 1 - Probabilidades, Amostragem E Teste De Hipótese

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Considere a seguinte regressão:

Vendasi = 10,0 + 1,25 R&Di + 1,0 ADVi - 2,0 COMPi + 8,0 CAPi

Onde Vendas são em milhões, Research & Development (R&D) são os gastos de pesquisa e desenvolvimento em milhões, ADV é o valor gasto em propaganda em milhões, COMP é o número de concorrentes na indústria, e CAP são os gastos de capital para o período em milhões. A interpretação correta dessa informação é que:

a) Se a companhia gastar $1 milhão em capital (mantendo todo o resto constante), é esperado que as vendas subam $ 18,0 milhões.
b) Um competidor a mais significará $ 2 milhões a menos em vendas (mantendo o resto constante).
c) Se os gastos com R&D e propaganda são $1 milhão cada, há 5 concorrentes, e gastos com capital são $2 milhões, as vendas esperadas serão $ 8,5 milhões.
d) Se a companhia gastar $1 milhão em pesquisa e desenvolvimento, é esperado que as vendas subam $ 1,25 milhões.

A

b) Um competidor a mais significará $ 2 milhões a menos em vendas (mantendo o resto constante).

A alternativa B está correta pois dado tudo constante, o aumento de 1 unidade da variável independente concorrentes, impactará exatamente em perda de 2 milhões de vendas. Na alternativa A o valor de aumento está incorreto pois se mantivermos tudo constante a diferença nas vendas são 8 milhões. A alternativa D está incorreta pois não afirma nada sobre o nível das outras variáveis. A alternativa C está incorreta: Vendas previstas = $10 + 1,25 + 1 – 10 + 16 = $18,25 milhões.

  • Quero achar esse exercicio na apostila.

Prova 1 - Regressão E Séries Temporais

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Um gestor escolhe o IBX como benchmark de sua carteira e contrata hedge para eliminar o risco cambial. Como parte de suas pesquisas, testa a hipótese de que o excesso de retorno de sua carteira pode ser explicado pela seguinte regressão:

Retorno da Carteira – Taxa Livre de Risco = α + b1IBX + b2Cambio + ε, onde α = 0,5, b1 = 1 e b2 = 0.

Durante a fase do feedback, o gestor constatou um baixo percentual da variação total do excesso de retorno de sua carteira explicado pelas variáveis independentes. Qual a mais evidente limitação da regressão formulada pelo gestor?

a) Valor esperado do resíduo não é zero.
b) Resíduo não é normalmente distribuído.
c) Variável dependente não está linearmente relacionada com cada uma das variáveis independentes.
d) Variável independente é correlacionada com os resíduos.

A

c) Variável dependente não está linearmente relacionada com cada uma das variáveis independentes.

Ao contratar o hedge e verificar que b2 = 0, o gestor não deveria considerar na regressão o câmbio como variável independente, pois não há um relacionamento linear deste com a variável dependente, ou seja, com o excesso de retorno de sua carteira. Os dados fornecidos no enunciado não são suficientes para a análise dos demais pressupostos.

Prova 1 - Regressão E Séries Temporais

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

A média de idade de uma população é igual a 35 e a média de idade de uma amostra de tamanho 64 é igual a 36. Sendo a variância da amostra igual a 16, o erro padrão da média amostral é aproximadamente:

a) 0,50
b) 0,75
c) 1,00
d) 2,00

A

a) 0,50

o erro padrão da média amostral deve ser estimado pela divisão do desvio padrão da média amostral (s) por √n. Sendo assim e considerando que o enunciado informou a variância da amostra, e não o seu desvio padrão, temos: Erro padrão da média amostral = √16 / √64 = 4 / 8 = 0,50

Prova 1 - Probabilidades, Amostragem E Teste De Hipótese

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Um fundo que exibe uma distribuição normal em seus retornos e cuja média é de 0,4% a.m., com desvio padrão (DP) de 0,05%, expressa uma probabilidade de apresentar um retorno de 0,6% em determinado mês mais próxima de:

a) zero.
b) 1%.
c) 5%.
d) 10%.

A

a) zero.

Com três DP, temos 99,73% das observações contidas dentro da área sob a curva normal. Sendo assim, a probabilidade do fundo apresentar um retorno superior a três DP distante de sua média, ou seja, maior que 0,4% + (3 x 0,05%) = 5,5%, é inferior a 0,27%.

Simulado 2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qual o Coeficiente de Correlação de uma regressão linear com duas variáveis independentes, cujo modelo evidencia que 80% da variação da variável dependente é explicada pela primeira variável independente?

a) 0,75.
b) 0,80.
c) 0,89.
d) Não pode ser calculado com as informações disponíveis.

A

d) Não pode ser calculado com as informações disponíveis.

Em regressões lineares simples, isto é, aquelas com apenas uma variável independente, o coeficiente de determinação R2 pode ser computado elevando ao quadrado o coeficiente de correlação (r). Entretanto, esta relação não é válida quando mais de uma variável independente é utilizada na regressão, o que é o caso da regressão linear múltipla. Neste caso, o R2 pode ser calculado através da Tabela ANOVA.

Prova 1 - Regressão E Séries Temporais

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

É considerada uma violação que não causa a menor consequência para um Regressão:

a) Heterocedasticidade não condicional.
b) Heterocedasticidade condicionada.
c) Auto correlação positiva.
d) Multicolinearidade.

A

a) Heterocedasticidade não condicional.

A Heterocedasticidade ocorre quando a variância dos resíduos não é a mesma entre todas as observações abrangidas na análise. A Heterocedasticidade é não condicional quando não está relacionada com o nível da variável independente, o que não causa maiores consequências para a regressão. Um problema é quando constatada uma Heterocedasticidade condicionada ao nível da variável independente, pois neste caso, as estimativas de erro padrão não são confiáveis. A auto correlação positiva existe quando o erro positivo de um período aumenta a probabilidade de observarmos um erro positivo no período subsequente. o efeito da correlação positiva é um menor erro padrão, o que gera uma maior incidência de erros Tipo I, ou seja, o de rejeitarmos a hipótese nula quando ela é verdadeira. A Multicolinearidade se refere a uma situação onde duas ou mais variáveis independentes em uma regressão múltipla são altamente correlacionadas uma com a outra. Esta condição distorce o erro padrão da estimativa e dos coeficientes, levando a problemas na condução dos testes t para avaliação dos parâmetros de significância.

Prova 1 - Regressão E Séries Temporais

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Uma analista de ações está avaliando a variação das vendas da indústria XYZ. Tendo uma amostra de 100 dias, ela calculou que a média de vendas diária é R$ 120.000,00, e o desvio padrão é de R$ 2.500,00. Qual o intervalo de confiança, com 5% de significância? O Z-Score correspondente ao nível de significância de 5% é 1,96.

a) R$ 119.500 a R$ 120.500.
b) R$ 115.200 a R$ 125.300.
c) R$ 112.800 a R$ 138.100.
d) R$ 118.700 a R$ 122.500.

A

a) R$ 119.500 a R$ 120.500.

Da teoria de estatística, sabemos que se a distribuição amostral de médias amostrais é uma distribuição normal. O intervalo de confiança é igual a 120± 1,96*2,5/√100 = 119,5 a 120,5

Simulado 3

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Dada a equação de previsão: xt = 5 + 1,75 xt-1, qual é o valor previsto de xt+2 se xt-1 é 16,5?

a) 33,87
b) 64,28
c) 117,49
d) 210,61

A

c) 117,49

Dado xt–1 = 16,5, xt= 5 + 1,75(16.5) = 33,875. Então, xt+1= 5 + 1,75xt = 5 + 1,75(33,875) = 64,28. Então, xt+2= 5 + 1,75xt = 5 + 1,75(64,28) = 117,49.

Simulado 3

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

A partir de uma amostra de 64 debêntures high-yield um gestor encontrou um retorno médio 14% e um desvio padrão de 25%. A inferência estatística válida para esses retornos seria que o verdadeiro retorno da população está entre:

a) 7,8% e 20,1%, com 95% de confiança.
b) 7,0% e 21,0%, com 95% de confiança.
c) 6,5% e 22,3%, com 90% de confiança.
d) 4,1% e 23,9%, com 99% de confiança.

A

a) 7,8% e 20,1%, com 95% de confiança.

Inferência estatística significa estimar qual é a verdadeira média da população, sem conhecê-la. Se queremos 95% de confiança nessa estimativa, usamos um z-crítico de 1.96. Se queremos 90% de confiança, usamos um z-crítico de 1.64 e se queremos 99% de confiança, usamos um z-crítico de 2.58. Com 95% de confiança, por exemplo, ela estaria no intervalo 14%1.96 * 25%/√64 = 7,88%≤Ret≤20.13. Com 90% confiança estaria entre 8.875% e 19.125%. Com 99% confiança estaria entre 5.937% e 22.06%. A única alternativa que mostra um intervalo aceitável é A.

  • Ainda não entendi bem pq isso aqui é inferência de confiança de média populacional com variância conhecida.
    Tem que decorar tambem o 90%, 95% e 99%.

Prova 1 - Probabilidades, Amostragem E Teste De Hipótese

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Um gestor acredita que as regressões múltiplas são muito úteis na previsão de retorno dos ativos, por isso ele fez uma série de experimentos para calcular o retorno das ações da Petrobrás com base no retorno do Dólar, Ibovespa e petróleo. Ele chegou à seguinte equação: PETR = 0,5% - 2 DOL + 1,5 IBOV + 1,2 OIL + Є. Sobre essa equação foram feitas as seguintes afirmativas:

I. O coeficiente linear de 0,5% significa que, quando o retorno do IBOV é igual a zero, o retorno da PETR3 é de 0,5%.
II. O coeficiente angular do dólar de -2 pode ser interpretado como uma evidência que, para cada 1% de variação do dólar, a PETR varia na direção oposta em 2%, mantidos os coeficientes IBOV e OIL constantes.
III. Com base no teste de significância t dos coeficientes podemos concluir se cada um deles é estatisticamente diferente de zero.

Está correto o que se afirma apenas em:

a) I e II
b) I e III
c) II e III
d) I, II e III

A

c) II e III

A afirmativa I é incorreta, pois a interpretação do coeficiente linear em regressões múltiplas é que, somente quando todos os coeficientes angulares, e não apenas um deles, forem iguais a zero, o retorno da variável dependente será igual ao termo intercepto. Ou seja, somente se os retornos do IBOV, Dólar e Petróleo forem todos iguais a zero, podemos afirmar que o retorno da PETR3 será igual a 0,5%. A afirmativa II está correta, pois corresponde a uma interpretação correta para os coeficientes angulares em regressões múltiplas. A afirmativa III é correta, pois o teste t é utilizado para avaliar individualmente a significância de cada um dos coeficientes, e se todos forem estatisticamente diferentes de zero, a equação pode ser utilizada da forma em que foi estimada.

Simulado 4

22
Q

10% dos alunos graduados de faculdades contratados permanecem em seu primeiro emprego por mais de 5 anos. Numa amostra de 60 alunos contratados recentemente, a probabilidade que exatamente 2 alunos ficarão no mesmo emprego por mais de 5 anos será:

a) 0,0892
b) 0,0984
c) 0,114.
d) 0,184.

A

b) 0,0984

Sucesso em ficar 5 anos = [6!/ 2!(6-2)!] * (0,10)^(2) * (0,90)^(6-2) = 15*(0,01)(0,656) = 0,0984

Prova 1 - Probabilidades, Amostragem E Teste De Hipótese

23
Q

Qual das seguintes afirmações sobre uma distribuição normal é menos precisa?

a) Aproximadamente 68% das observações se encontram dentro de 1 desvio padrão (acima e abaixo) da média.
b) A média e a variância completamente definem uma distribuição normal.
c) A distribuição normal tem kurtosis superior a três.
d) Metade da população se encontra acima da média.

A

c) A distribuição normal tem kurtosis superior a três.

Mesmo que as curvas normais tenham tamanhos diferentes, todos eles têm características idênticas na forma. A kurtosis para todas as distribuições normais é de três, um excesso de kurtosis dos três poderia indicar uma distribuição leptocúrtica. Ambas as opções restantes são verdadeiras.

Prova 1 - Probabilidades, Amostragem E Teste De Hipótese

24
Q

Analise os resultados das regressões mensais de empréstimos imobiliários (RE) em bilhões de dólares pelos bancos comerciais no período de janeiro de 2010 a setembro de 2013 no quadro seguinte:

Resultados da Regressão de Séries Temporais para Empréstimos Imobiliários

Modelo: REt = b0 + b1t + εt = 1, 2, …, 45

Gráfico / Imagem 6

A regressão de crédito imobiliário contra o tempo é um (a):

a) Modelo de tendência linear.
b) Modelo AR.
c) Modelo ARCH.
d) Modelo log-linear.

A

a) Modelo de tendência linear.

Com um modelo de tendência, a variável independente é o tempo, t.

  • Os outros modelos que tem nas alternativas tem na apostila?

Prova 1 - Regressão E Séries Temporais

25
Q

Um gestor acredita que as regressões múltiplas são muito úteis na previsão de retorno dos ativos, por isso ele fez uma série de experimentos para calcular o retorno das ações da Petrobrás com base no retorno do Dólar, Ibovespa e petróleo. Ele chegou à seguinte equação: PETR = 0,5% - 2 DOL + 1,5 IBOV + 1,2 OIL + Є. Sobre essa equação foram feitas as seguintes afirmativas:

I. Com base no teste de significância da estatística F podemos concluir se todos os coeficientes são estatisticamente diferentes de zero.

II. Com base no teste de significância da estatística F podemos concluir se a equação é válida pois pelo menos um coeficiente é estatisticamente diferente de zero.

III. Com base no teste de significância t dos coeficientes podemos concluir se cada um deles é estatisticamente diferente de zero.

Está correto o que se afirma apenas em:

a) I e II
b) I e III
c) II e III
d) I, II e III

A

c) II e III

O teste t é utilizado para ver individualmente a significância de cada um dos coeficientes, e se todos forem estatisticamente diferentes de zero, a equação pode ser utilizada da maneira que foi feita. O teste F diz se pelo menos um dos coeficientes é estatisticamente diferente de zero e por isso pode ser utilizado. Nesse caso a equação não deve produzir bons resultados, pois só se pode afirmar que um dos coeficientes é estatisticamente diferente de zero.

Simulado 4

26
Q

Marque a alternativa que contempla apenas procedimentos utilizados para testar uma hipótese:

a) Delimitar da variável aleatória, definir o nível de significância e estabelecer a regra de decisão.
b) Definir o nível de significância, gerar valores aleatórios e calcular a estatística amostral.
c) Selecionar o teste estatístico, estabelecer a regra de decisão e calcular a estatística amostral.
d) Selecionar o teste estatístico, calcular a probabilidade de sucesso e estabelecer a regra de decisão.

A

c) Selecionar o teste estatístico, estabelecer a regra de decisão e calcular a estatística amostral.

O teste de hipóteses é um procedimento estatístico baseado na análise de uma amostra, que consiste nas seguintes etapas: 1) especificar as hipóteses nula e alternativa; 2) selecionar o teste estatístico apropriado; 3) definir o nível de significância; 4) estabelecer a regra de decisão em função das hipóteses; 5) coletar a amostra e calcular a estatística amostral. 6) tomar uma decisão em face da regra de decisão das hipóteses; e 7) tomar uma decisão com base no resultado dos testes, que pode ser, inclusive, econômica ou de investimento. Sendo assim, a única alternativa que abrange apenas procedimentos supracitados é aquela que relaciona: selecionar o teste estatístico, estabelecer a regra de decisão e calcular a estatística amostral. Por outro lado, os procedimentos de delimitar a variável aleatória, gerar valores aleatórios e calcular probabilidade de sucesso não são inerentes a testes de hipóteses.

Simulado 4

27
Q

Sobre um teste de hipótese com probabilidade de um erro tipo II de 70% e probabilidade de erro tipo I de 5%, é possível afirmar que:

I. O poder do teste é de 30%.
II. Há 30% de probabilidade de rejeitar a hipótese nula quando ela é falsa.
III. Há 5% de probabilidade que a hipótese nula será rejeitada quando ela é verdadeira.

Está correto apenas o que se afirma em:

a) I.
b) I e II.
c) III.
d) I, II e III.

A

d) I, II e III.

A afirmativa I e II são corretas, pois o poder do teste é a probabilidade de corretamente rejeitar a hipótese nula quando ela é falsa. Sendo assim, o poder do teste corresponde a um menos a probabilidade de cometer um erro de Tipo II, isto é, 1 – P(Erro Tipo II), no caso, 1 – 0,70 = 0,30 = 30%. A afirmativa III também está correta, pois um erro de tipo I consiste em rejeitar uma hipótese nula que é verdadeira, ou seja, chegar a um resultado que tem significância estatística quando na verdade ele aconteceu por acaso. O símbolo para a probabilidade de um erro de tipo I é α (alpha) e é por vezes descrito como o tamanho ou nível de significância do teste. Por exemplo, um nível de significância de 5% (α = 0,05) significa que há uma chance de 5% de rejeitar uma hipótese nula que é verdadeira.

Simulado 4

28
Q

Qual dos seguintes modelos está ajustado para sazonalidade?

a) Vendast = b0 + b1 Vendas t-1 + εt.
b) (Vendast - Vendast-1) = b0 + b1(Vendas t-1 - Vendast-2) + b2(Vendast-4 - Vendast-5) + εt.
c) Vendast = b1 Vendas t-1+ εt.
d) Vendast = b0 + b1 (Vendas t-1 - Vendast-2) + εt.

A

b) (Vendast - Vendast-1) = b0 + b1(Vendas t-1 - Vendast-2) + b2(Vendast-4 - Vendast-5) + εt.

O modelo é um AR sazonal com first differencing.

  • Acho que isso está na pagina 31 da apostila digital, mas nao tenho certeza

Prova 1 - Regressão E Séries Temporais

29
Q

O modelo de regressão dos retornos da ação Alpha obedece a seguinte equação logarítmica:

Gráfico / Imagem 27

corresponde à variável dependente, enquanto que t à variável independente. Qual o retorno periódico de uma ação adquirida e vendida dois anos depois, considerando uma taxa de 6% a.a.?

a) 18,00%
b) 18,62%
c) 19,10%
d) 12,74%

A

d) 12,74%

A equação logarítmica evidencia que o modelo de retorno da regressão corresponde à capitalização contínua. O retorno do período de dois anos é obtido através de aplicação direta na fórmula, com a multiplicação da taxa anual pelo número de períodos: = 12,74%.

Gráfico / Imagem 28

Simulado 5

30
Q

A Estatística F é a estatística utilizada para testar a hipótese de que:

a) todos os coeficientes da regressão (excluindo a constante) são nulos.
b) pelo menos um coeficiente da regressão é nulo.
c) o termo aleatório da regressão é nulo.
d) as variáveis dependentes não são correlacionadas.

A

a) todos os coeficientes da regressão (excluindo a constante) são nulos.

Estatística F é a estatística utilizada para testar a hipótese de que todos os coeficientes da regressão (excluindo a constante) são nulos.

Simulado 5

31
Q

Utilizando os seguintes resultados das amostras tirados com 25 observações das suas distribuições subjacentes, testar se o retorno médio da carteira vale 0 com 1% de significância estatística.

  • Retorno 4,25%
  • Desvio padrão 6,25%
  • Estatística t para 24 graus de liberdade ao nível de 1% de significância estatística = 2,807
  • Hipótese nula (H0): Retorno = 0

Com base na comparação pareado das duas carteiras, a conclusão mais apropriada é que H0 deve ser:

a) aceitar porque a estatística ultrapassa 2.807.
b) rejeitar porque a estatística ultrapassa 2.807.
c) aceitar porque a estatística foi inferior a 2.807.
d) nenhuma das anteriores.

A

b) rejeitar porque a estatística ultrapassa 2.807.

Neste caso, o teste estatístico é igual a: (4,25-0) / (6,25 / √25) = 3,40. Como 3,40> 2,807, a hipótese nula de que o retorno é zero é rejeitada.

Simulado 5

32
Q

Um analista verifica as seguintes estatísticas t em quatro amostras de 20 observações, onde a média populacional de retornos é igual a zero.

Tabela 39

Caso escolhido um nível de 5% de significância em um teste de hipótese bicaudal, o analista deve rejeitar a hipótese nula ao considerar as amostras:

Tabela 40

a) A e B
b) B e C
c) A e D
d) C e D

A

c) A e D

O valor crítico da estatística t utilizando a Distribuição t-Student, em um teste bicaudal a um nível de 5% de significância, para amostras de 20 observações e 19 degraus de liberdade, é +/- 2,093. Os degraus de liberdade correspondem ao tamanho da amostra menos um. Considerando que as estatísticas t das amostras A e D se situam, respectivamente, à esquerda de -2,093 e à direita de +2,093, elas se encontram na área de rejeição da hipótese nula. As amostras B e C se encontram em intervalo que nos remete a falhar em rejeitar a hipótese nula.

Simulado 5

33
Q

Qual o Coeficiente de Correlação de uma regressão linear simples cujo modelo evidencia que 80% da variação da variável dependente é explicada pela variável independente?

a) 0,75.
b) 0,80.
c) 0,89.
d) Não pode ser calculado com as informações disponíveis.

A

c) 0,89.

Em regressões lineares simples, isto é, aquelas com apenas uma variável independente, o Coeficiente de Determinação (R2) pode ser computado elevando ao quadrado o Coeficiente de Correlação (r). Sendo assim: Coeficiente de Correlação = √Coeficiente de Determinação Coeficiente de Correlação = √0,8 Coeficiente de Correlação = 0,89

  • Coeficiente de Determinação (R2)

Prova 1 - Regressão E Séries Temporais

34
Q

Um procedimento comumente utilizado nos modelos de Regressão Linear é denominado:

a) Método da Variância.
b) Método da Covariância.
c) Método dos Mínimos Quadrados.
d) Análise Combinatória.

A

c) Método dos Mínimos Quadrados.

A linha de regressão é aquela que minimiza a Soma dos Quadrados dos Erros (SQE), daí a denominação de Método dos Mínimos Quadrados.

  • O somatório dos quadrados das diferenças entre os valores estimados e os reais de Y são referenciados como a Soma dos Quadrados dos Erros (SQE), ou dos Resíduos. Portanto, a linha de regressão é aquela que minimiza o SQE. Isto explica por que a linha da regressão é conhecida com a reta dos mínimos quadrados e os valores da variável dependente estimados através da equação da regressão, Ŷi, são denominadas estimativas dos mínimos quadrados.

Prova 1 - Regressão E Séries Temporais

35
Q

Uma regressão entre os retornos de uma ação e do índice setorial em que atua apresenta os seguintes resultados:

Tabela 4

  • Coeficiente Erro Padrão
    Interseção 2,1 2,01
    Índice 1,9 0,31
  • Erro padrão = 15,1
  • Coeficiente de correlação = 0,849

Se o retorno do índice for 4%, o retorno esperado desta ação será:

a) 6,1%.
b) 7,6%.
c) 9,7%.
d) 11,2%.

A

c) 9,7%.

Y = b0 + bX1 Y = 2,1 + 1,9(4) = 9,7%

  • Eu acho que é nessa parte aqui da apostila: Interpretando um Coeficiente de Regressão pg 93 da fisica e 4 da digital
    Por que o B0 é 2,1 e o B1 2,9 e não o contrário?

Prova 1 - Regressão E Séries Temporais

36
Q

Use os seguintes valores de distribuição t para estabelecer um intervalo de confiança de 95% para a média da população dado um tamanho de amostra de 10, a média amostral de 6,25 e um desvio padrão da amostra de 12. Suponha que a população da qual a amostra é retirada é normalmente distribuída e a variância da população não é conhecida.

O intervalo de confiança de 95% é mais próximo de um limite inferior de:

a) -0,71 e um limite superior de 13,21.
b) -2,20 e um limite superior de 14,70.
c) -2,33 e um limite superior de 14,83.
d) -2,52 e um limite superior de 15,90.

A

c) -2,33 e um limite superior de 14,83.

Com um tamanho de amostra 10, há nove graus de liberdade. O conceito de intervalo de confiança desse exercício é baseado em uma abordagem de duas caudas. Para um intervalo de confiança de 95%, 2,5% da distribuição será em cada cauda. Assim, a estatística t a ser usada é 2,262. O intervalo de confiança é calculado como 6,25 ± 2,262 × 12 / √10 = 6,25 ± 8,58369 ou -2,33 até 14,83.

*Pg 68 da apostila fisica

Prova 1 - Probabilidades, Amostragem E Teste De Hipótese

37
Q

Qual a covariância entre os ativos A e B, sendo que a correlação entre eles é 0,6 e o desvio padrão de A é 12% e de B é 16%?

a) 1,22%.
b) 1,01%.
c) 1,09%.
d) 1,15%.

A

d) 1,15%.

A fórmula da correlação é: ρa,b = Cov a,b / σA σB 0,6 = Cov a,b / 0,12 x 0,16 Cov a,b = 0,01152 ou 1,152%

Prova 1 - Estatística

38
Q

Uma carteira composta por dois ativos, é 15% investida no ativo A (variância = 0,0071) e 85% no ativo B (variância= 0,0008). O coeficiente de correlação entre os ativos é -0,04. Neste caso, a variância da carteira será:

a) 0,026.
b) 0,0007.
c) 0,0004.
d) 0,0020.

A

b) 0,0007.

A variância da carteira é dada por: [W1² σ1² + W2² σ2² + 2W1W2σ1σ2r1,2] [(0,15)2(0,0071) + (0,85)2(0,0008) + (2)(0,15)(0,85)(0,0843)(0,0283)(–0,04)]

Prova 1 - Estatística

39
Q

A média dos retornos anuais de ações small cap desde a sua criação foi 17,7%, seu desvio padrão foi 33,9%. O intervalo de confiança de 95% para o retorno de ações small cap em qualquer ano é (alfa = 1,96):

a) - 48.7% a 84.1%
b) - 16.8% a 18.6%
c) - 16.2% a 51.6%
d) - 48.7% a 18.6%

A

a) - 48.7% a 84.1%

Um nível de confiança de 95% está a 1.96 desvios padrões da média, então 0.177 ± 1.96(0.339) = (-48.8 , 84.1%).

Prova 1 - Estatística

40
Q

Os valores a seguir representam amostras do retorno anual de empresas do setor moveleiro. A estimativa do desvio padrão e variância do retorno para o setor serão:

Empresa 1: 15%
Empresa 2: 2%
Empresa 3: 5%
Empresa 4: -7%
Empresa 5: 0%

a) Variância = 0,324% e Desvio Padrão = 5,7%.
b) Variância = 0,645% e Desvio Padrão = 8,0%.
c) Variância = 0,220% e Desvio Padrão = 4,7%.
d) Variância = 0,516% e Desvio Padrão = 7,2%.

A

b) Variância = 0,645% e Desvio Padrão = 8,0%.

Retorno médio = (0,15+ 0,02+ 0,05- 0,07+ 0,00)/ 5= 0,03 Variância = [(0,15-0,03)^2 + (0,02-0,03)^2 + (0,05-0,03)^2 + (-0,07-0,03)^2 + (0,0-0,03)2 ]/4 = (0,0144 + 0,0001 + 0,0004 + 0,01 + 0,0009) / 4 = 0,0258/ 4 = 0,00645 Usamos (n-1) no denominador para amostras, portanto (5-1) = 4 Desvio Padrão = 0,00645^0,5 = 0,08 ou 8%. Pela calculadora HP 12C Limpe os registros, utilizando f REG 15 Σ+ (aparecerá no visor o número 1) 2 Σ+ (aparecerá no visor o número 2) 5 Σ+ (aparecerá no visor o número 3) 7 CHS Σ+ (aparecerá no visor o número 4) 0 Σ+ (aparecerá no visor o número 5) Desvio Padrão amostral: g . (ponto final) = 8,03%. Para cálculo da variância, precisamos elevar o desvio padrão ao quadrado. Porém, primeiro precisamos expressar o desvio padrão na forma decimal. 8,03 enter 100 ÷ 2 yx 100 x = 0,645%.

Prova 1 - Estatística

41
Q

Um matemático está pesquisando a média salarial anual dos gerentes de marketing da indústria hoteleira de São Paulo. Ele quer testar se a média salarial anual é maior que 100 mil reais. Uma amostra com os salários anuais de 30 gerentes é analisada. A média dos salários na amostra é de 102 mil reais. Assumindo um desvio padrão de 5 mil reais, e sabendo que o valor crítico do teste para um nível de significância de 5% (one-tail) é 1,69, podemos dizer que:

a) Rejeitamos a hipótese nula e concluímos que a média salarial é superior a 100 mil reais anuais.
b) Não rejeitamos a hipótese nula e concluímos que a média salarial é superior a 100 mil reais anuais.
c) Rejeitamos a hipótese nula e concluímos que a média salarial é inferior a 100 mil reais anuais.
d) Não rejeitamos a hipótese nula e concluímos que a média salarial é inferior a 100 mil reais anuais.

A

a) Rejeitamos a hipótese nula e concluímos que a média salarial é superior a 100 mil reais anuais.

Primeiro definimos a hipótese nula. Ho: Salário Anual é igual ou menor que 100. A seguir calculamos a estatística do teste: Test Stat = (102 - 100) / (5 / √30) = 2,19. Como a estatística do teste é maior que o valor crítico para esse nível de significância, rejeitamos a hipótese nula.

Prova 1 - Probabilidades, Amostragem E Teste De Hipótese

42
Q

Uma regressão entre os retornos de uma ação e do índice setorial em que atua apresenta os seguintes resultados:

Tabela 4

  • Coeficiente Erro Padrão
    Interseção 2,1 2,01
    Índice 1,9 0,31
  • Erro padrão = 15,1
  • Coeficiente de correlação = 0,849

A variação percentual no retorno da ação explicada pela variação do retorno do índice é aproximadamente:

a) 91,3%.
b) 84,9%.
c) 72,1%.
d) 63,2%.

A

c) 72,1%.

O coeficiente de determinação, R2, é igual ao coeficiente de correlação ao quadrado ou seja: 2 0,8492 = 0,721.

  • Coeficiente de Determinação (R2)
    Como eu chego no coeficiente de correlação? E como eu sei que quando ele pede a variação percentual de uma ação vs o indice ele está falando de R2?

Prova 1 - Regressão E Séries Temporais

43
Q

Para a seguinte série temporal: Yt = 5.7 + 0.446 Yt-1 , se for estacionária, qual seria a média para qual essa serie reverteria?

Se atualmente a serie estiver em 9.0, o que se pode afirmar?

a) 10,28 e a série deverá cair.
b) 10,28 e a série deverá subir.
c) 5,74 e a série deverá subir.
d) 5,74 e a série deverá cair.

A

b) 10,28 e a série deverá subir.

Xt = 5,7/(1-0,446) = 10,28 Se a série está em 9.0, como está abaixo da média, deveríamos esperar que esse valor suba.

Prova 1 - Regressão E Séries Temporais

44
Q

Sobre a distribuição t de Student, é possível afirmar que:

I. É definida por um único parâmetro, o tamanho da amostra.
II. Apresenta maiores probabilidades nas caudas que a distribuição normal.
III. Os intervalos de confiança sob a distribuição t de Student são comparativamente mais largos, isto é, menos conservadores, que aqueles construídos com a distribuição normal.

Está correto apenas o que se afirma em:

a) I.
b) I e II.
c) III.
d) I, II e III.

A

b) I e II.

A afirmativa I está correta, já que os fatores de confiança da distribuição t de Student variam em função do tamanho da amostra. A afirmativa II também está correta, pois em face de possuir caudas mais largas que a distribuição normal padronizada, os intervalos construídos sob a distribuição t de Student são comparativamente mais largos. A afirmativa III é incorreta, pois sendo mais largos, os intervalos de confiança sob a distribuição t de Student são mais conservadores que aqueles construídos com sob a distribuição normal.

Prova 1 - Probabilidades, Amostragem E Teste De Hipótese

45
Q

Na regressão múltipla, a medida relativa de adequação da regressão é denominada:

a) coeficiente de correlação.
b) coeficiente de regressão.
c) coeficiente de determinação.
d) termo aleatório.

A

c) coeficiente de determinação.

O coeficiente de determinação (R2) é a relação entre a variação explicada pela equação de regressão múltipla e a variação total da variável dependente. Assim, R2=0,75 significa que 75% da variância é explicada pelo modelo.

Prova 1 (Prova mesmo, não fixando conceitos)

46
Q

O retorno médio anual das ações small cap entre os períodos de 1980-2010 foi 15,8% e o desvio padrão da amostra foi 25,6%. Com o intervalo de confiança de 99% (alfa 2,58), o retorno destas ações ficará entre:

a) - 48,7% a 84,1%.
b) - 16,8% a 18,6%.
c) - 16,2% a 51,6%.
d) 3,7% a 27,8%.

A

d) 3,7% a 27,8%.

Um nível de confiança de 99% está a 2,58 desvios padrões da média, como precisamos achar o Intervalo de Confiança de uma população com base em uma amostra o desvio padrão fica s /(n)^0,5. Para os valores dados temos que 0,256 /(30)^0,5. Nesse caso o IC = 0,158 ± 2,58(0,046) = (3,7%; 27,8%).

Prova 1 (Prova mesmo, não fixando conceitos)

47
Q

O Coeficiente de Determinação é uma medida estatística que recai no seguinte intervalo:

a) (0, 1).
b) (-1, 0).
c) (-1, +1).
d) (-infinito, +infinito).

A

a) (0, 1).

O Coeficiente de Determinação (R2) é um número que recai no intervalo entre 0 e 1, sendo definido como a percentagem da variação total da variável dependente que é explicada pela variável independente.

Prova 1 - Regressão E Séries Temporais

48
Q

Quando há correlação serial dos dados, o modelo mais adequado a ser usado é:

a) de tendência log-linear.
b) de tendência linear.
c) auto-regressivo.
d) sazonal.

A

c) auto-regressivo.

O modelo de tendência log-linear seria melhor do que um modelo de tendência linear quando há correlação serial dos dados. No entanto, pode ocorrer que nem mesmo um modelo log-linear seja apropriado na presença de correlação serial. Neste caso, os modelos auto-regressivos seriam melhores.

Prova 1 (Prova mesmo, não fixando conceitos)

49
Q

Sobre o teste de hipóteses, pode-se afirmar que:

a) Hipótese nula Ho é a hipótese que o investigador quer verificar.
b) Hipótese alternativa (H1) é a hipótese que traduz a ausência do efeito que se quer verificar.
c) O nível de significância é a probabilidade de rejeitar a hipótese nula quando ela é efetivamente verdadeira.
d) Um Teste de Hipóteses pode ser somente paramétrico.

A

c) O nível de significância é a probabilidade de rejeitar a hipótese nula quando ela é efetivamente verdadeira.

A e B estão incorretas – os conceitos estão trocados. D está incorreta- Um Teste de Hipóteses pode ser paramétrico ou não-paramétrico.

Prova 1 (Prova mesmo, não fixando conceitos)

50
Q

Um analista está testando a hipótese de que o retorno excedente médio de uma estratégia de investimento é menor ou igual a zero. O analista reporta que este teste de hipótese produz um p-value de 0,034. Este resultado sugere que:

a) A hipótese nula pode ser rejeitada ao nível de significância de 5%.
b) A melhor estimativa do retorno excedente médio produzido pela estratégia é 3,4%.
c) O menor nível de significância no qual a hipótese nula pode ser rejeitada é 6,8%.
d) O p value apenas é insuficiente para concluir, para rejeitar a hipótese nula é preciso da média e desvio.

A

a) A hipótese nula pode ser rejeitada ao nível de significância de 5%.

Um p-value de 0,035 significa que a hipótese pode ser rejeitada ao nível de significância de 3,5% ou mais. Assim, a hipótese pode ser rejeitada ao nível de significância 10% ou 5%, mas não pode ser rejeitada ao nível de significância de 1%.

Simulado 2