2. Math & Statistics - Exploratory Data Analysis Flashcards
Quais são os gráficos mais comuns para variáveis qualitativas?
Barras
Composição em setores (pizza)
Quais são os gráficos mais comuns para variáveis quantitativas?
Gráfico de Dispersão Unidimensional
Gráfico em Barras
Histograma da variável
Ramo-e-Folhas
Qual cuidado precisa ter ao criar intervalos de classes desiguais?
Usar a densidade para saber a classe mais populada no lugar da frequência.
Qual a medida de densidade?
n i / Delta i
onde:
N i = elemento.
Delta i = Amplitude = Diferença entre o maior e o menor elemento.
O que é média aparada?
Esta medida envolve calcular a média das observações centrais, desprezando-se uma porcentagem das iniciais e finais.
Quais são os quatro tipo de variáveis utilizadas?
Variável Qualitativa Nominal
Variável Qualitativa Ordinal
Variável Quantitativa Discreta
Variável Quantitativa Contínua
Quais são as medidas de posição mais comuns?
Média
Mediana
Moda
Quais são as medidas de dispersão mais comuns?
Variância
Desvio Padrão
Como calcular a média de elementos de variável quantitativa contínua?
Utiliza-se a frequência
Soma(Ponto Médio * frequência)/Número Elementos
Como calcular a variância?
Sigma^2 = Soma((Elemento - Média)^2)/Número Elementos
Qual a função da variância e desvio padrão?
Ambas as medidas de dispersão (dm e dp) indicam em média qual será o “erro” (desvio) cometido ao tentar substituir cada observação pela medida resumo do conjunto de dados (no caso, a média).
Como calcular a variância de variáveis contínuas?
var(S) ~= soma(frequência(ponto médio - média)^2…)/número elementos
Qual a diferença para o cálculo da amostra?
divide-se o resultado por n -1, em vez de n.
Como calcular a variância de observações repetidas
Multiplica-se a frequência pelo (elemento - média)^2
O que é Simposon’s paradox
it is a phonomena that happens when confounding factors are not observed in the data and become a hidden confounder.