Estatística Flashcards
Quais sãos as medidas de Tendência central?
Média, Mediana e Moda
O que é a moda?
O valor mais frequente num conjunto de dados
O que é a mediana?
O ponto médio de um conjunto de dados
Quais são as medidas de disperão?
O desvio-padrão, variância
O que é o desvio-padrão?
Corresponde ao erro médio de um conjunto de observações em relação a média. Representa o quão longe valores amostrais individuais estão distantes da média amostral como um todo.
O que é a variância?
O quadrado do desvio-padrão, representa medida de variabilidade ou de dispersão, ao elevar o desvio-padrão ao quadrado busca-se eliminar as dispersões negativas ao longo da amostra, ao mesmo tempo sem perder a informação.
Qual a formula do desvio padrão?
σ = √((Σ(x - x̄)²) / (n - 1))
O que são medidas de associação entre duas variáveis?
Covariância e Correlação
O que significa covariância e correlação?
Covariância pode ser interpretado como um indicador do sentido em que duas variáveis se movimentam, caso a covariância seja um valor positivo, significa que as variáveis se movimentam juntos positivamente, enquanto que uma covariância negativa, implica o contrário, que as variáveis se movimentam em sentidos opostos.
Enquanto que a correlação diz respeito ao grau de co-movimentação das duas variáveis, estando entre -1 e 1, 1 significando uma relação linear positiva entre as duas variáveis, e -1 o contrário uma relação linear negativa. 0 implica em falta de padrão
Qual é a relação de média, moda e mediana nos casos de assimetria da distribuição normal?
Para assimetria à esquerda (média a esquerda), temos que média < mediana < moda.
Para assimetria à direita (média a direita), temos que média > mediana > moda.
Qual a interpretação do Z-value?
O valor Z representa a quantidade de desvios padrões da média determinado valor estocástico se encontra.
A probabilidade para determinado valor Z representa a probabilidade de uma observação estar a esquerda. E no caso de simetria F(-z) = 1 - F(z)
Como descrever a distribuição lognormal?
A distribuição criada a partir da transformação logarítimica das observações numéricas de uma amostra. Tem como característica ser limitada à 0 à esquerda, e infinita à direita, criando portanto caudas longas a direita e assimetria.
Como descrever a distribuição t de student?
É uma distribuição contínua, com a mesma forma em sino da distribuição normal e maior variabilidade em função do tamanho da amostra (gl = n-1). onde n é o numero de observações
Assume variância populacional desconhecida.
Usa graus de liberdade
Quanto maior os gl(amostra) mais se aproxima da normal
Quantos graus de liberdade há em uma amostra com 50 observações?
49, porque gl = n-1
Porque a distribuição de t de student se aproxima da distribuição normal quanto maior o tamanho da amostra?
Porque quanto maior o número de observações mais próximo da população a amostra é, e como a distribuição normal é baseada na observação da população, por isso a aproximação.