Estatística Flashcards
Quais sãos as medidas de Tendência central?
Média, Mediana e Moda
O que é a moda?
O valor mais frequente num conjunto de dados
O que é a mediana?
O ponto médio de um conjunto de dados
Quais são as medidas de disperão?
O desvio-padrão, variância
O que é o desvio-padrão?
Corresponde ao erro médio de um conjunto de observações em relação a média. Representa o quão longe valores amostrais individuais estão distantes da média amostral como um todo.
O que é a variância?
O quadrado do desvio-padrão, representa medida de variabilidade ou de dispersão, ao elevar o desvio-padrão ao quadrado busca-se eliminar as dispersões negativas ao longo da amostra, ao mesmo tempo sem perder a informação.
Qual a formula do desvio padrão?
σ = √((Σ(x - x̄)²) / (n - 1))
O que são medidas de associação entre duas variáveis?
Covariância e Correlação
O que significa covariância e correlação?
Covariância pode ser interpretado como um indicador do sentido em que duas variáveis se movimentam, caso a covariância seja um valor positivo, significa que as variáveis se movimentam juntos positivamente, enquanto que uma covariância negativa, implica o contrário, que as variáveis se movimentam em sentidos opostos.
Enquanto que a correlação diz respeito ao grau de co-movimentação das duas variáveis, estando entre -1 e 1, 1 significando uma relação linear positiva entre as duas variáveis, e -1 o contrário uma relação linear negativa. 0 implica em falta de padrão
Qual é a relação de média, moda e mediana nos casos de assimetria da distribuição normal?
Para assimetria à esquerda (média a esquerda), temos que média < mediana < moda.
Para assimetria à direita (média a direita), temos que média > mediana > moda.
Qual a interpretação do Z-value?
O valor Z representa a quantidade de desvios padrões da média determinado valor estocástico se encontra.
A probabilidade para determinado valor Z representa a probabilidade de uma observação estar a esquerda. E no caso de simetria F(-z) = 1 - F(z)
Como descrever a distribuição lognormal?
A distribuição criada a partir da transformação logarítimica das observações numéricas de uma amostra. Tem como característica ser limitada à 0 à esquerda, e infinita à direita, criando portanto caudas longas a direita e assimetria.
Como descrever a distribuição t de student?
É uma distribuição contínua, com a mesma forma em sino da distribuição normal e maior variabilidade em função do tamanho da amostra (gl = n-1). onde n é o numero de observações
Assume variância populacional desconhecida.
Usa graus de liberdade
Quanto maior os gl(amostra) mais se aproxima da normal
Quantos graus de liberdade há em uma amostra com 50 observações?
49, porque gl = n-1
Porque a distribuição de t de student se aproxima da distribuição normal quanto maior o tamanho da amostra?
Porque quanto maior o número de observações mais próximo da população a amostra é, e como a distribuição normal é baseada na observação da população, por isso a aproximação.
O que é simulação de monte carlo?
Técnica estatística que identifica os fatores de risco de um ativo e estabelece uma função de distribuição de probabilidade para simular o comportamento de cada fator.
Primeiro gera-se inúmeros valores aleatórios para inferir a média ou desvio padrão.
É utilizado para precificar estruturas complexas e opções americanas, calcular V@R e simular L/P em trades.
Quais são os tipos mais comuns de amostragem?
Amostragem simples, em que se escolhe de maneira aleatória a sua amostra.
Amostragem estratificada, em que se consiste em dividir a população em subgrupos sem interseção.
O que é erro de amostragem?
Erro da amostragem é a diferença entre a estatística da amostra e a estatística da população, Ou seja
Erro amostral = estatística de amostra - estatística da população
Descreva o teorema do limite central
O teorema que descreve que para uma amostra suficientemente grande, a distribuição amostral se aproxima a uma distribuição normal ou seja, mais me aproximo da média da população.
Como o teorema do limite central pode ser aplicado?
Em testes de hipótese e nos intervalos de confiança sobre uma população com dados amostrais.
O que é o erro amostral?
O erro amostral ou erro padrãoda média amostral é o desvio-padrão da distribuição das médias amotrais.
Quando o desvio-padrão da população é conhecido
Como é calculado o erro amostral?
E = Z * (s / √n) (quando a amostra for superior à 30)
E = t * (s / √n) (quando inferior à 30)
O que é uma estimativa por ponto e por intervalo?
Uma estimativa por ponto segue a lógica de encontrar um resultado através de apenas um unico outro valor, então x=y, quando tenho um estimador por intervalo, significa que o resultado é definido por um intervalo de valores, ou seja x=+-y
Quais são os intervalos de confiança mais utilizados?
1,645 para 90%, alpha de 10%
1,960 para 95%, alpha de 5%
2,575 para 99%, alpha de 1%
(bicaudal)
Como se calcula o intervalo do estimador por intervalo?
Estimativa por ponto +- (fator de confiança * erro padrão) ou seja erro padrão = s / raiz(n)
O que é o alpha estatístico?
Alfa é o nível de significancia, ou seja é a probabilidade de se cometer o erro TIPO I (rejetar H0 sem haver evidências o suficiente para rejeitar H0)
Qual é um sinônimo para graus de liberdade?
Nível crítico
Qual a relação entre desvio padrão e variância?
O desvio-padrão é a raiz da variância
Como é calculado o retorno histórico?
Somatório dos retornos / numero de retornos
Como calcular covariância e correlação?
cov = Σ((x - x̄) * (y - ȳ)) / (n - 1)
r = cov / (sX * sY)
Onde sX e SY é o desvio padrão amostral de X e Y respectivamente
O que significa uma distribuição de probabilidade ser contínua e uniforme?
Significa que temos um intervalo de observações cujos resultados tem a mesma probabilidade acontecer. Para calcular uma probabilidade nessa distribuição seria apenas calcular a area.
Qual é o valor da média e desvio padrão numa distribuição normal?
Média = 0 e Desvio padrão = 1