Estatística multivariada Flashcards

1
Q

Como se dá a organização de dados na estatística multivariada?

A

Considerar os dados na forma de arrays facilita a exposição do assunto
matéria e permite que cálculos numéricos sejam realizados de forma ordenada e eficiente maneiras. A eficiência é dupla, pois os ganhos são alcançados em ambos (1) descrever cálculos como operações em matrizes e (2) a implementação dos cálculos em computadores, que agora usam muitas linguagens e pacotes estatísticos para realizar operações de array.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quais são as principais medidas avaliadas na estatística descritiva básica?

A

.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qual a principal propriedade da correlação?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Como é calculada a covariância amostral?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Como é calculada a correlação amostral?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quais são as matrizes básicas da estatística descritiva?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qual é a base da maioria das técnicas multivariadas?

A

A maioria das técnicas multivariadas é baseada no conceito simples de distância, especificamente a distância em linha reta ou distância Euclidiana.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qual a diferença entre a distância euclidiania e a distância estatística?

A

A distância euclidiania, que vem do teorema de piágoras, sendo uma linha reta entre dois pontos calculado por:
d²(O, P)=x1²+x2²+…+xp²=c² (partindo da origem). Ou, entre dois pontos que não partam da origem:
d²(x, y)=(x1-y1)²+(x2-y20²+…+(xp-yp)²=c².
a distância estatística diferencia pois calcula a distância entre varições e, oportunamente, a presença de correlação.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Por que a distância euclidiana pode não ser adequada para todos os propósitos estatísticos?

A

Ela não leva em consideração a correlação entre as variáveis nem a variabilidade diferencial entre elas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

O que é a distância estatística e como ela difere da distância euclidiana?

A

A distância Euclidiana é insatisfatória para fins estatísticos porque cada coordenada contribui igualmente para o cálculo da distância, sem considerar as variações de magnitude que podem estar sujeitas a flutuações aleatórias.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Por que é desenvolvida a “distância estatística” na análise multivariada?

A

Ela é pondera coordenadas com base em sua variabilidade.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Como a distância estatística difere da distância Euclidiana padrão?

A

A distância estatística difere da Euclidiana padrão ao incorporar pesos baseados nas variações das amostras, resultando em coordenadas “padronizadas” que são usadas na fórmula Euclidiana para determinar a distância.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Como a correlação entre variáveis afeta a medida de distância em análise multivariada?

A

A correlação entre variáveis afeta significativamente a medida de distância, pois variáveis correlacionadas alteram a forma como a distância é percebida no espaço multivariado. A distância estatística é ajustada para levar em conta essa correlação, além da variabilidade de cada variável.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

O que a elipse de distância constante representa em um gráfico de dispersão bidimensional?

A

Representa os pontos que estão a uma distância estatística constante do centro, levando em conta a variabilidade e correlação entre as variáveis.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Como a distância estatística é generalizada para espaços multivariados?

A

A generalização é feita usando a matriz de covariância dos dados para calcular a distância estatística em espaços de dimensão maior que dois.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

O que são contornos de igual probabilidade em estatística?

A

São linhas que conectam pontos com a mesma probabilidade de ocorrência, refletindo a distribuição conjunta das variáveis.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Por que contornos de igual probabilidade formam uma elipse em vez de um círculo quando há correlação entre as variáveis?

A

Porque a correlação distorce a distribuição uniforme, estendendo mais a dispersão ao longo da direção da correlação, resultando em uma elipse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

O que acontece com a forma dos contornos de igual probabilidade quando as variáveis têm a mesma variabilidade mas são correlacionadas?

A

Os contornos são elípticos e inclinados em relação aos eixos, com eixos de igual comprimento representando a mesma variabilidade nas variáveis correlacionadas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Por que valores maiores em uma direção com maior variabilidade são menos surpreendentes?

A

Valores maiores são menos surpreendentes em uma direção com maior variabilidade porque esses valores são esperados dentro do intervalo natural de dispersão dos dados.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Como você pode padronizar variáveis com variabilidades diferentes antes de calcular a distância?

A

Você pode padronizar as variáveis dividindo cada coordenada pelo desvio padrão correspondente, equalizando assim a variabilidade relativa de cada variável.

21
Q

Por que é necessário a padronização dos dados?

A

A padronização dos dados é necessária neste caso para lidar com o problema da variabilidade diferencial entre as variáveis. Se uma variável varia mais que outra, as distâncias nessa direção terão uma escala diferente. Ao padronizar, dividindo cada valor pelo desvio padrão da sua variável, equalizamos a escala das variáveis. Isso significa que uma unidade de desvio padrão em uma variável tem o mesmo “peso” ou importância que uma unidade de desvio padrão em outra, tornando a medida de distância mais justa e comparável entre as dimensões. Isso é crucial em muitas análises estatísticas multivariadas, como a Análise de Componentes Principais, onde se busca comparar a variabilidade entre diferentes variáveis de forma equitativa.

22
Q

Como a padronização afeta a comparação entre diferentes variáveis?

A

A padronização coloca as variáveis em pé de igualdade, permitindo uma comparação justa mesmo quando têm diferentes variabilidades.

23
Q

Qual é a importância da rotação do sistema de coordenadas na análise de distância?

A

A rotação do sistema de coordenadas é importante para alinhar os eixos com a direção de maior variação nos dados. Isso simplifica a interpretação dos dados e a medida de distância, especialmente em presença de correlação entre as variáveis.

24
Q

Como são calculadas as distâncias estatísticas em um sistema de coordenadas rotacionado?

A

As distâncias estatísticas em um sistema de coordenadas rotacionado são calculadas ajustando as fórmulas de distância para levar em conta as novas orientações dos eixos. Isso envolve usar as variações e correlações das variáveis nas novas direções dos eixos.

25
Q

Como é a equação generalizada da distância estatística?

A
26
Q

Como é calculada a distância estatística em um sistema de coordenadas rotacionado a partir dos eixos originais?

A
27
Q

O que são e como são representados vetores?

A
28
Q

Como pode ser expandido ou contraído um vetor?

A
29
Q

Como ocorre a soma de vetores?

A
30
Q

Como se dá o cálculo do comprimento de um vetor x e sua transposta x’?

A
31
Q

O que acontece na multiplicação de um vetor por um escalar?

A
32
Q

O que é o vetor unitário?

A
33
Q

Como é calculado o ângulo entre dois vetores?

A
34
Q

Como calcular o produto interno entre dois vetores?

A
35
Q

Como calcular o ângulo entre dois vetores através de seu produto interno?

A
36
Q

Como calcular o produto interno de dois vetores com n dimensões?

A
37
Q

Como calcular o ângulo de um vetor e o ânculo entre dois vetores através do produto interno?

A
38
Q

Como calcular a projeção de um vetor em outro?

A
39
Q

o que são matrizes simétricas?

A
40
Q

O que são matrizes inversas?

A
41
Q

O que é uma matriz ortonormal?

A
42
Q

O que são autovalores e autovetores?

A
43
Q

Quais as propriedades dos autovalores e autovetores?

A
44
Q

O que é análise espectral?

A

A decomposição espectral, também conhecida como decomposição em autovalores, é um processo que transforma uma matriz, especialmente uma matriz simétrica, em uma forma que revela sua estrutura espectral, isto é, seus autovalores e autovetores.

45
Q

Como é realizada a decomposição espectral?

A
46
Q

O que é matriz não negativa definida? e positiva definida?

A
47
Q

O que é uma matriz positiva definida na análise espectral?

A
48
Q
A