2. Math & Statistics - Exploratory Data Analysis Flashcards

1
Q

Quais são os gráficos mais comuns para variáveis qualitativas?

A

Barras

Composição em setores (pizza)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quais são os gráficos mais comuns para variáveis quantitativas?

A

Gráfico de Dispersão Unidimensional
Gráfico em Barras
Histograma da variável
Ramo-e-Folhas

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qual cuidado precisa ter ao criar intervalos de classes desiguais?

A

Usar a densidade para saber a classe mais populada no lugar da frequência.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qual a medida de densidade?

A

n i / Delta i

onde:

N i = elemento.
Delta i = Amplitude = Diferença entre o maior e o menor elemento.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

O que é média aparada?

A

Esta medida envolve calcular a média das observações centrais, desprezando-se uma porcentagem das iniciais e finais.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quais são os quatro tipo de variáveis utilizadas?

A

Variável Qualitativa Nominal
Variável Qualitativa Ordinal
Variável Quantitativa Discreta
Variável Quantitativa Contínua

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quais são as medidas de posição mais comuns?

A

Média
Mediana
Moda

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quais são as medidas de dispersão mais comuns?

A

Variância

Desvio Padrão

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Como calcular a média de elementos de variável quantitativa contínua?

A

Utiliza-se a frequência

Soma(Ponto Médio * frequência)/Número Elementos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Como calcular a variância?

A

Sigma^2 = Soma((Elemento - Média)^2)/Número Elementos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qual a função da variância e desvio padrão?

A

Ambas as medidas de dispersão (dm e dp) indicam em média qual será o “erro” (desvio) cometido ao tentar substituir cada observação pela medida resumo do conjunto de dados (no caso, a média).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Como calcular a variância de variáveis contínuas?

A

var(S) ~= soma(frequência(ponto médio - média)^2…)/número elementos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qual a diferença para o cálculo da amostra?

A

divide-se o resultado por n -1, em vez de n.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Como calcular a variância de observações repetidas

A

Multiplica-se a frequência pelo (elemento - média)^2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

O que é Simposon’s paradox

A

it is a phonomena that happens when confounding factors are not observed in the data and become a hidden confounder.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

O que é confounding

A

Duas variáveis associadas a uma causa, no entanto uma variável está escondida, não é conhecida.

17
Q

Is Association also causation?

A

No

18
Q

What is the correct way to establish a cause-effect relation?

A
  1. Randomized experiment with treatment group and control group to avoid placebo effect. Blinded experiment.
  2. Quando não é possível realizar o experimento, tem uma área da estatística chamada Causual Inference que trata de como usar o método estatístico em observações para estabelecer causa e efeito entre variáveis.