Estatística Descritiva: Medidas de Variância ou Dispersão Flashcards

1
Q

Medidas de variação ou dispersão

A

MEDIDAS DE DISPERSÃO
Dispersão passa a ideia de algo que se afasta. Nesse caso, afasta-se da média aritmética.

MEDIDAS DE POSIÇÃO
As medidas de posição (média, mediana, moda) descrevem apenas uma das características dos valores numéricos de um conjunto de observações, o da tendência central.
Porém nenhuma delas informa sobre o grau de variação ou dispersão dos valores observados. Em qualquer grupo de dados, os valores numéricos não são semelhantes e apresentam
desvios variáveis em relação a tendência geral de média. Isto é, em um grupo de dados, os
números não são tão semelhantes, podendo ser possível perceber uma variação. Por exemplos, as notas de um simulado ou o desempenho de alguns funcionários público em uma
prova de capacitação.
Portanto é importante perceber não somente a média, porque esta sofre influência dos
extremos, mas também os desvios das variáveis em relação à tendência geral da média.
As medidas de dispersão servem para avaliar o quanto os dados são semelhantes, descreve, então, o quanto os dados distam do valor central. Desse jeito, as medidas de dispersão servem também para avaliar qual o grau de representação da média, isto é, se a média
é 5, sabe-se que pode haver pessoas que tiraram uma nota 0 ou uma nota 10, mas se o
desvio-padrão é 5, sabe-se que, da média para baixo, é mais ou menos 2, e da média para
cima, é dois para cada lado. É aquilo que desvia da média. Então, o desvio-padrão vai além
da média aritmética. Ele mostra a variação, aquilo que destoa do que seria um padrão.

A variação é quando se tem a média, mas se percebe que há alguns desvios (d1, d2,
d3, d4, d5, d6, d7). Mesmo que o desvio seja igual a média, haverá um desvio zero. A soma
desses desvios é igual a zero. Essa é uma propriedade importante.

d1+ d2 + d3 + d4 + d5 + d6 + d7 = 0

O desvio é:

d= (Xn - x̅)

É fácil demonstrar que apenas a média é insuficiente para descrever um grupo de dados.
Dois grupos (ou mais) podem ter a mesma média, mas serem muito diferentes na amplitude
de variação de seus dados. Por exemplo:
* Grupo A (dados observados): 5; 5; 5.
* Grupo B (dados observado): 4; 5; 6.
* Grupo C (dados observados): 0; 5; 10.
A média, por si só, não demonstra uma realidade, não caracteriza o grupo.
Imagine que o exemplo acima seja de uma capacitação de funcionários. Em cada grupo,
há três pessoas. No grupo A, todos tiraram 5, então a média é 5 e, nos grupos B e C, a média
também foi cinco. Contudo, os três grupos não possuem as mesmas características. Não
será possível avaliar esses profissionais da mesma maneira, já que as notas foram muito
diferentes.

Escolher um profissional que tirou zero não será o mesmo que escolher um profissional
que tirou 10. É por isso que o desvio-padrão é importante, porque caracteriza melhor o grupo.

Caso se falasse apenas das médias, seria possível ter a impressão de que os grupos
são semelhantes. Contudo, quando se sabe o desvio-padrão, percebe-se que eles não são
semelhantes. O desvio no grupo A é zero. O desvio no grupo C é bem maior, porque as notas
são totalmente heterogêneas. O grupo A é mais homogêneo.

A média dos três grupos é a mesma (5), mas no grupo “A” não há variação entre os dados,
enquanto no grupo “B” a variação é menor que no grupo “C”. Dessa forma, uma maneira mais
completa de apresentar os dados (além de aplicar uma medida de tendência central como a
média) é aplicar uma medida de dispersão.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quais são as medidas de variação?

A

Determina a característica de variação ou dispersão de um conjunto de dados:
1. Amplitude
2. Desvio
3. Desvio médio ou desvio absoluto
4. Desvio padrão
5. Variância

ATENÇÃO:
O importante é saber que:
* a amplitude total é o menor e maior valor da amostra.
* a soma dos desvios é igual a zero.
* a soma dos quadrados é a soma dos quadrados dos desvios.
* a variância amostral é a soma dos desvios ao quadrado sobre n menos 1.
* a variância populacional é o somatório dos desvios ao quadrado sobre N.
* o desvio-padrão amostral será a raiz quadrada de S² e o desvio padrão populacional
será a raiz quadrada da variância. Isto é:

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Amplitude

A

Diferença entre o maior e o menor valor. Subtraia o menor valor do maior.

Amplitude = 1,88 – 1,60 = 0,28 m

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Desvio e desvio absoluto

A

Desvio
* Diferença entre cada valor e a média

Desvio médio ou absoluto
* Média dos desvios em termos absolutos
ΣIx- x̅I / n
Obs.: as barras indicam o módulo, para
que todos fiquem positivos. Caso contrário, a soma dos desvios seria zero.

Obs.: o desvio pode dar positivo ou negativo. Isso depende de ele estar acima ou abaixo da média. Quando está acima da média, é positivo e, quando está abaixo, é negativo. É por isso que a variância (S²) é elevada ao quadrado, isto é, para resolver esse problema de ser negativo.

Desvio-padrão
Medida da variação dos valores em relação à média.
Ex.: calcular o desvio-padrão do conjunto de dados ao lado.
Passo 1: calcule a média;
Passo 2: calcule o DEVIO de cada medida sobre a
média
Desvio = x- x̅
Calcule o desvio-padrão do conjunto de dados
ao lado.
Passo 3: eleve ao quadrado cada uma das
diferenças;
Passo 4: some todos os quadrados obtidos
Σ(x- x̅)²
Passo 5: divida o total por (n-1), onde n é o número de dados coletados (amostra);
Passo 6: extraia a raiz quadrada do resultado anterior
Desvio padrão = √Σ(x- x̅)² / n-1

A variância é quando se pega cada desvio e soma. Contudo dois desvios podem ser
negativos. Uma ferramenta, além do módulo, para transformá-los em positivo é elevar ao
quadrado.

S² = Σ(x- x̅)² / n-1

Observação: a unidade do desvio-padrão é a mesma unidade dos valores originais ou
conjunto de dados.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Fórmula extra de variância

A

A variância pode ser a média dos quadrados menos o quadrado das médias.

O uso de cada fórmula vai depender do que a questão do concurso traz. Muitas vezes, a
questão não traz os valores apresentados nas tabelas acima. Muitas vezes, a banca afirma
que o quadrado da média é de um valor x e a média dos quadrados é y. Nesse caso, utilize
esta segunda fórmula da variância.

Exemplo:
X – = {1,2,3}

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qual a diferença de desvio padrão e variância?

A

O desvio-padrão é a raiz quadrada da variância: Ou, de forma similar, a variância é o quadrado do desvio-padrão.

Desvio padrão = √Σ(x- x̅)² / n-1
S² = Σ(x- x̅)² / n-1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

COEFICIENTE DE VARIAÇÃO

A

O Coeficiente de Variação indica a magnitude relativa do desvio-padrão quando comparado à média do conjunto de valores.

O Coeficiente de Variação é útil para compararmos a variabilidade (dispersão) de dois
conjuntos de dados de ordem de grandezas diferentes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

COEFICIENTE DE VARIAÇÃO

Exemplo prático

Seja o seguinte conjunto de preços de geladeiras em 7 lojas distintas.

A

Seja o seguinte conjunto de preços de liquidificadores nas mesmas lojas acima.

Qual dos produtos têm uma maior variabilidade de preços?
Pelo coeficiente de variação, consegue-se avaliar duas grandezas diferentes: carros
novos e carros usados, produtos enlatados e produtos orgânicos etc.

Uma vez que, em geral, uma geladeira custa bem mais que um liquidificador, a tendência
é que o desvio-padrão da geladeira seja também maior.
O coeficiente de variação é uma medida adimensional que normaliza o desvio-padrão em
relação à média. A média e o desvio-padrão possuem a mesma unidade de medida. É por
isso que, muitas vezes, aparece em porcentagem. Não há unidade de medida.

CV(gel) = 25,63/787,14
CV(gel) = 3,3%

CV(liq) = 4,81/49,14
CV(liq) = 9,8%

Com o CV podemos concluir que os preços da geladeira têm uma menor variabilidade que os do liquidificador. Os preços das geladeiras variam menos, com relação à média, que os do liquidificador.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

(UFAC/ESTATÍSTICO/2019) Um estudo foi desenvolvido com uma espécie de cupuaçu
devido a sua importância socioeconômica para região Amazônica. Uma das variáveis
estudadas tinha um caráter quantitativo contínuo, “Altura de Parte Aérea” – APA, em
milímetros (mm). Abaixo dispomos uma amostra das APA de 10 plantas após 45 dias de
experimento:
* Amostra (mm): 8; 14; 20; 9, 11; 13; 8; 11; 20;13.
* Com base nessas informações amostrais, tem-se o seguinte resumo descritivo:
– Valor Mínimo: 8; 1º Quantil: 9,5; Mediana: 12; Média: 12,7; 3º Quantil: 13,7;
– Valor Máximo:20; Desvio-padrão: 4,3.
Dessa forma, é correto afirmar que o coeficiente de variação é:
a. 12,00%.
b. 4,25%.
c. 12,70%.
d. 33,86%.
e. 290,35%

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

PROPRIEDADES DO DESVIO-PADRÃO E DA VARIÂNCIA

A
  1. Somando-se (ou subtraindo-se) a cada elemento uma constante qualquer, o Desviopadrão e a Variância não se alteram.
  2. Multiplicando-se (ou dividindo-se) cada elemento por uma constante qualquer:
    2.1. O desvio-padrão fica multiplicado (ou dividido) por essa constante;
    2.2. A variância fica multiplicada (ou dividida) PELO QUADRADO dessa constante.
    Por exemplo, se há um conjunto de valores de alturas e a estas se somam 5 centímetros,
    o desvio e variância não se alteram. Por outro lado, se cada uma das alturas for multiplicada
    ou dividida por dois, por exemplo, o novo desvio-padrão também estará multiplicado por
    dois. No caso da variância, o novo desvio-padrão estará multiplicado pelo quadrado dessa
    constante. Assim, se as alturas foram multiplicadas por dois, a variância será multiplicada pelo quadrado de dois, que é quatro.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

(UFU-MG/UFU-MG/TÉCNICO EM ESTATÍSTICA/2019) Considere que o coeficiente de
variação de uma amostra de preços dos aluguéis na cidade de Uberlândia em 2018 foi de 80%. O IGPM indica que, para 2019, os preços devem ter uma retração de 10%.
Se os aluguéis dessa amostra forem reajustados, conforme o IGPM, o novo coeficiente de variação será de:
a. 64%
b. 80%
c. 70%
d. 16%

A

b. 80%

O coeficiente que está variando. Entre a média e o desvio-padrão foi de 80%. Então, há
aluguel barato e aluguel caro.
Quando se diminui 10% de alguma coisa, é multiplicar por 0,9. Cuidado! Não é subtrair.
Portanto, a constante é a multiplicação de 0,9.

Essa multiplicação não vai mudar nada, porque 0,9 corta 0,9 e sobrará a mesma coisa de
2018. O coeficiente de variação permanece o mesmo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

(FCC/PREFEITURA DE RECIFE/PE/ANALISTA DE GESTÃO ADMINISTRATIVA/2019)
Considere uma população P formada por números estritamente positivos. Com relação
às medidas de tendência central e de dispersão é correto afirmar que
a. multiplicando todos os elementos de P por 16, o desvio-padrão da nova população é
igual ao desvio-padrão de P multiplicado por 4.
b. dividindo todos os elementos de P por 2, a variância da nova população é igual a
variância de P multiplicada por 0,25.
c. adicionando uma constante K > 0 a todos os elementos de P, a média aritmética e a
variância da nova população formada são iguais a média aritmética e desvio-padrão de
P, respectivamente.
d. a variância e o desvio-padrão de P são iguais somente no caso em que todos os
elementos de P são iguais.

A

LETRA B.

a. Se multiplicar por 16, o novo desvio-padrão também fica multiplicado por 16.
b. A variância da nova população fica dividida por 2², que é o mesmo que multiplicar por
¼, isto é, multiplicar por 0,25.
c. Se está somando, a média altera. O desvio-padrão e a variância não se alteram, mas
a média, sim.
d. Pode-se ter valores diferentes.
e. O desvio-padrão não se altera quando se subtrai. A média, por outro lado, pode sim
alterar.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

(FADESP/UEPA/TÉCNICO DE NÍVEL SUPERIOR/ESTATÍSTICA/2020) Sejam X e Y
duas variáveis quaisquer e definamos X = Y + K. Então, com relação ao Coeficiente de
Variação, pode-se afirmar que
a. CV(X) < CV(Y), se k< 0
b. CV(X) = CV(Y), se k<0
c. CV(X) < CV(Y), se K>0.
d. CV(X) > CV(Y), se k>0.

A

c. CV(X) < CV(Y), se K>0.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

(UFAC/ESTATÍSTICO/2019) Analise as seguintes assertivas:
I – A moda e o desvio-padrão são medidas de dispersão,
II – O desvio médio e a média são medidas de dispersão,
III – O coeficiente de variação e a variância são medidas de dispersão,
IV – A moda, a média e o desvio-padrão são medidas de posição.
Pode-se afirmar que estão corretas:
a. Apenas i. e ii.
b. Apenas ii. e iii.
c. Apenas iii.
d. Apenas iv.
e. Apenas i. e iv.

A

c. Apenas iii.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

(FCC/BANRISUL/ESCRITURÁRIO/2019) Uma população é formada por 4 elementos,
ou seja, {4, 5, 5, 8}. O coeficiente de variação, definido como o resultado da divisão do
respectivo desvio-padrão pela média aritmética da população, é igual a
a. 3/11.
b. 9/22.
c. 3/22.
d. 9/11.
e. 1/5.

A

a. 3/11.

  1. Encontra a média;
  2. Calcula a variância;
  3. Encontra o desvio aplicando a raiz no valor da variância.
  4. Calcula o CV que é o desvio dividido pela média.

Média = (4+5+5+8)/4 = 11/2
Variância = (4²+5²+5²+8²)/4 - (11/2)² = 9/4
Desvio = √9/4 = 3/2
CV = (3/2) / (11/2) = 3/11

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

(VUNESP/TJ-SP/ADMINISTRADOR JUDICIÁRIO/2019) Os salários de todos os
160 funcionários de uma determinada carreira de nível médio em um órgão público
apresentam um coeficiente de variação igual a 20%. Sabe-se que a soma dos valores
desses salários elevados ao quadrado é igual a 4.160x(R$ 1.000,00)².
O valor do respectivo desvio-padrão é então igual a:
a. R$ 1.000,00
b. R$ 1.200,00
c. R$ 800,00
d. R$ 720,00
e. R$ 1.500,00

A

a. R$ 1.000,00

AULA 24 REVER A QUESTÃO LÁ.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

(CESGRANRIO/PETROBRÁS/ANALISTA DE COMERCIALIZAÇÃO E LOGÍSTICA JÚNIOR/TRANSPORTE MARÍTIMO) A média dos salários dos funcionários de uma empresa é R$ 4.000,00, e o desvio padrão, R$ 1.000,00. O reajuste dos salários desses funcionários será realizado em duas etapas. Na primeira etapa, o reajuste será de 5% incidindo
sobre o salário inicial e, depois de um determinado período, haverá novo reajuste de 5%
incidindo sobre o salário já reajustado. Ao final das etapas de reajustes salariais, a variância dos salários será a variância dos salários iniciais, multiplicada por:
a. 1.
b. 1,05.
c. 1,05 elevado a 2
d. 1,05 elevado a 3
e. 1,05 elevado a 4
.

A

e. 1,05 elevado a 4

+5% = 100% + 5% = 105%
105/100 = 1,05
Para aplicar um reajuste de 5%, basta multiplicar por 1,05, o que resultará no montante
com o aumento de 5%.
É necessário observar as propriedades. Aumentar 5% é o mesmo que multiplicar todos
os salários, individualmente, por 1,5. Ao multiplicar o conjunto de valores por uma constante, o desvio padrão será multiplicado pela constante e a variância será multiplicada
pelo quadrado da constante.
No caso de soma, a resposta seria 1, mas para aumentar 5%, deve-se multiplicar por 1,05.
O número 1 representa o valor principal e o número,05 é o ajuste sobre o valor principal.
A operação, portanto, não é de soma, mas de multiplicação. Utiliza-se a propriedade da
variância. Ao multiplicar os valores por 1,05, a variância será multiplicada pelo quadrado
da constante (1,05).

K = 1,05
1º Reajuste: Salário. (1,05)²
Após um determinado período, há um novo reajuste de 5%.
2º Reajuste: S. (1,05)² x (1,05)²
Conserva a base e soma os expoentes.
S x (1,05)² x (1,05)²
= (1,05) elevado a 4
A variância dos salários será a variância inicial multiplicada por 1,05 elevado a 4.
.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

(2018/CESGRANRIO/BANCO DO BRASIL/ESCRITURÁRIO) Há dez anos a média das
idades, em anos completos, de um grupo de 526 pessoas era de 30 anos, com desvio
padrão de 8 anos.
Considerando-se que todas as pessoas desse grupo estão vivas, o quociente entre o
desvio padrão e a média das idades, em anos completos, hoje, é:
a. 0,45
b. 0,42
c. 0,20
d. 0,27
e. 0,34

A

c. 0,20

O quociente entre o desvio padrão refere-se ao coeficiente de variação.
Cv = S/ X
Cv = 8/30 (antes, -10 anos)
Soma-se 10 anos ao desvio padrão e à média aritmética. Isso gera consequências diferentes, pois o desvio padrão é inalterável.
Cv = 8/(30 + 10)
Cv = 8/40
Cv= 1/5 = 0,2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

(CESGRANRIO/PETROBRÁS/PROFISSIONAL JÚNIOR/ENGENHARIA DE PRODUÇÃO) Uma série com os últimos 50 preços do barril de petróleo apresenta uma média aritmética equivalente a 100 dólares americanos e uma variância de 25 dólares ao quadrado. O coeficiente de variação dessa amostra equivale a:
a. 0,05
b. 0,25
c. 1
d. 4
e. 20

A

a. 0,05

A unidade da variância sempre deve ser elevada ao quadrado. O desvio padrão é a unidade original.
X = 100,00
S² = 25,00
Cv = S/ X
S² = 25
D = √S = √25
D = 5
Cv = 5/100 = 0,05

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

(CESGRANRIO/EPE/ANALISTA DE PESQUISA ENERGÉTICA/PETRÓLEO ABASTECIMENTO) Uma amostra de tamanho 6 extraída de uma população de interesse forneceu os seguintes resultados:
1, 4, 5, 5, 7 e x.

Se o valor da média amostral é 2x, os valores da mediana amostral e da variância amostral são, respectivamente:
a. 4,5 e 4,8
b. 4,5 e 4
c. 5 e 4
d. 5 e 4,8
e. 5 e 5

A

a. 4,5 e 4,8

A mediana amostral é a medida de posição que é a principal separatriz (em 50%).
X = 1 + 4 + 5 + 5 + 7 + x/6
1 + 4 + 5 + 5 + 7 + x/6 = 2x
22 + x = 12x
11x = 22
X = 22/11
X= 2
Md = (1, 2, 4, 5, 5, 7)
Md = 4 + 5/2 = 4,5
É importante lembrar do fator de correção n – 1. Usa-se a forma convencional.
A média é 2x, ou seja, 4.
X = 4
S² =(1 – 4)² + (4 – 4)² + 2 (5 – 4) + (7 – 4)² + (2-4)²/6-1
S² = (9 + 2 + 9 + 4)/5
S² = 24/5 = 4,8

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

(2019/FCC/PREFEITURA DE RECIFE-PE/ANALISTA DE GESTÃO ADMINISTRATIVA)
Considere uma população P formada por números estritamente positivos. Com relação
às medidas de tendência central e de dispersão é correto afirmar que:
a. multiplicando todos os elementos de P por 16, o desvio padrão da nova população é
igual ao desvio padrão de P multiplicado por 4.
b. dividindo todos os elementos de P por 2, a variância da nova população é igual a variância de P multiplicada por 0,25.
c. adicionando uma constante K > 0 a todos os elementos de P, a média aritmética e a
variância da nova população formada são iguais a média aritmética e desvio padrão de
P, respectivamente.
d. a variância e o desvio padrão de P são iguais somente no caso em que todos os elementos de P são iguais.
e. subtraindo uma constante K > 0 de todos os elementos de P, o desvio padrão e a média aritmética da nova população são iguais ao desvio padrão e média aritmética de P
subtraídos de K, respectivamente.

A

LETRA B

a. Ao multiplicar todos os elementos por 16, o desvio padrão também será multiplicado
por 16. Se os elementos fossem somados por 16, o desvio padrão não sofreria alteração,
pois somar ou subtrair não altera o desvio padrão, apenas multiplicar e dividir.
b. Ao dividir os elementos por 2, a variância será dividida pelo quadrado de 2.
1/22
= 1/4 = 0,25
Dividir por 4 é equivalente a multiplicar por 0,25. Portanto, ao dividir por 2, a nova variância será dividida pelo quadrado de 2, que é 4 e equivale à multiplicação por 0,25.
c. Ao somar uma constante maior que zero a todos os elementos de P, a média aritmética será alterada, mas o desvio padrão será igual. A média aritmética será também somada à constante.
d. É possível haver uma variância de valor 1 em que os elementos de P sejam diferentes
ou em que os elementos sejam todos 1. A variância pode ser 1 e, consequentemente, a
raiz de 1 ser 1 e representar o desvio padrão.
σ² = 1.
σ² = √1 = 1
O valor 1 da variância pode ser conseguido com elementos iguais ou diferentes.
e. O desvio padrão não altera, apenas a média aritmética. A média aritmética subtrai o K.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

(FCC) Seja X uma variável com média 3 e coeficiente de variação igual a 0,5. Seja Y =
-2X + 3. As variâncias de X e Y são dadas, respectivamente, por:
a. 1,5 e 6.
b. 2,25 e 9.
c. 1,5 e 3.
d. 2,25 e 5.
e. 2,5 e 6.

A

Trata-se do cálculo de um parâmetro. Trabalha-se com variâncias – e, às vezes, com
média aritmética e desvio padrão. É necessário se atentar às propriedades.
X = 3
O coeficiente de variação do x é 0,5.
Cx = 0,5
Y = -2x + 3
Cx = Sx/ X
0,5 = Sx/3
Sx = 1,5
A variância é o resultado do quadrado do desvio padrão.
S² = (1,5)²
S² = 2,25
É necessário encontrar a variância de 5. Na equação Y = -2x + 3, a variável Y está em
função de X.
S²y = -2. Sx² + 3
S²y = -2 (2,25) + 3
A variância 2,25 deve ser multiplicada por uma constante e somada à constante +3.
Não se trata de uma conta matemática. Ao somar ou subtrair uma constante a uma variância, a variância continua inalterável. Somar +3 à variância, portanto, não provoca alteração.
S²y = -2 (2,25) + 3
Ao multiplicar uma constante pela variância, a nova variância será multiplicada pelo quadrado da constante.
S²y = (-2)2 x (2,25)
S²y = 4. (2,25) = 9
S²y = -2 (2,25) + 3
A variância 2,25 deve ser multiplicada por uma constante e somada à constante +3.
Não se trata de uma conta matemática. Ao somar ou subtrair uma constante a uma variância, a variância continua inalterável. Somar +3 à variância, portanto, não provoca alteração.
S²y = -2 (2,25) + 3
Ao multiplicar uma constante pela variância, a nova variância será multiplicada pelo quadrado da constante.
S²y = (-2)2 x (2,25)
S²y = 4. (2,25) = 9
S²y = 9

23
Q

(2018/CESPE/POLÍCIA FEDERAL/PERITO CRIMINAL FEDERAL-ÁREA 6) Considerando que a análise de uma amostra de minério de chumbo tenha apresentado os seguintes
resultados percentuais (%): 8,10; 8,32; 8,12; 8,22; 7,99; 8,31, julgue o item a seguir, relativo a esses dados.
O desvio padrão da análise em apreço é dado pela raiz quadrada do valor médio dividido
pelo número de amostras, no caso, 6. (CERTO/ERRADO)

A

ERRADO.

Variância amostral:
S²= Σ (x - x̅ )² /n – 1
Desvio padrão:
S² = √Σ (x - x̅ )² /n – 1
A amostra possui 6 elementos.
N = 6
Como se trata de um desvio padrão amostral, utiliza-se o n – 1.
6 – 1 = 5
O valor médio é dividido pelo número de amostras, que é 5.

24
Q

(2018/CESPE/POLÍCIA FEDERAL/PERITO CRIMINAL FEDERAL-ÁREA 6) Considerando que a análise de uma amostra de minério de chumbo tenha apresentado os seguintes
resultados percentuais (%): 8,10; 8,32; 8,12; 8,22; 7,99; 8,31, julgue o item a seguir, relativo a esses dados.
A variância dos dados em apreço é dada pelo valor do desvio padrão ao quadrado. (CERTO/ERRADO)

A

CERTO.

A variância é o desvio padrão ao quadrado = S²
O desvio padrão é a raiz quadrada da variância.

25
Q

(2018/CESPE/POLÍCIA FEDERAL/PERITO CRIMINAL FEDERAL-ÁREA 6) Considerando que a análise de uma amostra de minério de chumbo tenha apresentado os seguintes
resultados percentuais (%): 8,10; 8,32; 8,12; 8,22; 7,99; 8,31, julgue o item a seguir, relativo a esses dados.
O coeficiente de variação da análise é dado pela razão entre o desvio padrão e a média,
multiplicada por 100%. (CERTO/ERRADO)

A

CERTO.

Cv = Sx/ x̅
O coeficiente de variação é uma grandeza adimensional, ou seja, há mesma unidade no
numerador e no denominador.
Exemplo: para calcular o coeficiente de variação entre faixas salariais, o desvio padrão e
a média salarial serão dados em reais (R$). Ao fazer uma divisão reais por reais, os reais
se deletam.
Cv = Sx/X ̅
Cv = Sx/X ̅= 0,12
O coeficiente de variação indica o valor desviado da média salarial.
0,12 x100 = 12y
Nesse caso, o coeficiente de variação da faixa salarial entre os cargos de perito criminal, papiloscopista e agente é de 12%.
Obs.: o desvio padrão e a média aritmética são dados nas mesma unidade.

26
Q

(2018/CESPE/POLÍCIA FEDERAL/PERITO CRIMINAL FEDERAL-ÁREA 1) Tendo em
vista que, diariamente, a Polícia Federal apreende uma quantidade X, em kg, de drogas
em determinado aeroporto do Brasil, e considerando os dados hipotéticos da tabela precedente, que apresenta os valores observados da variável X em uma amostra aleatória
de 5 dias de apreensões no citado aeroporto, julgue o próximo item.

O desvio padrão amostral da variável X foi inferior a 7 kg. (CERTO/ERRADO)

A

CERTO.

Trata-se de uma variável quantitativa contínua, pois entre dois valores inteiros é possível
haver inúmeros valores.
1kg… 2kg
O desvio de padrão amostral possui um fator de correção.
X = Σ xi/j
X = (10 + 22 + 18 + 22 + 18)/5
X = 100/5 =
X = 20kg/d
A média por dia é de 2kg.
Variância:
S² = Σ (x - X )2 /n – 1
S²= (10–20)² + 2(22–20)² + (18–29)² + (28–20)² /5-1
S² =100 + 8 + 4 + 64 = 176/4
S² = 44
Desvio padrão:
S = √44
Se o valor do radical fosse 49, a raiz seria 7. Assim, a raiz de 44 é menor que 7.

27
Q

(2018/CESPE/IPHAN/ANALISTA I-ÁREA 2) Cinco municípios de um estado brasileiro possuem as seguintes quantidades de patrimônios históricos: {2, 3, 5, 3, 2}. Admitindo que a média e o desvio-padrão desse conjunto de valores sejam iguais a 3 e 1,2, respectivamente, julgue o item seguinte.
O coeficiente de variação é superior a 0,3 e inferior a 0,5. (CERTO/ERRADO)

A

CERTO.

X ̅= 3
S = 1,2
Cx = S/ X
Cx = 1,2/3 = 12/30
Cx = 0,4
O valor 0,4 é superior a 0,3 e inferior a 0,5.

28
Q

(SEFAZ-BA/FFC/2019) O coeficiente de variação de Pearson correspondente a uma população Pi
com média aritmética igual a 20 e tamanho 20 é igual a 30%. Decide-se excluir de P1 , em um determinado momento, dois elementos iguais a 11 cada um, formando uma nova população P2
. A variância relativa de P2 é igual a:
a. 10/147.
b. 4/49.
c. 16/147.
d. 8/49.
e. 4/441.

A

a. 10/147.

A variância é relativa ao quadrado da média.
Obs.: é um parâmetro pouco cobrado em concursos.
VR = σ²/( X)²
O coeficiente de variação é o desvio padrão em relação à média. A variância relativa é o
mesmo que o coeficiente de variação elevado ao quadrado.
Cv = S/ X
Cv = (S)²/( X)²
Ao elevar o coeficiente de variação ao quadrado, o numerador se torna a variância e o
denominador se torna o quadrado da média.
Para calcular a variância relativa, é necessária a variância e o quadrado da média.
P1: Cvp1= σ1/M
0,30 = σ1/20
σ1 = 6
Calcula-se a variância de P1:
σ² = 36

Ao calcular P2 , é necessário excluir dois elementos iguais a 11 cada um.
Σp1= n. p
Σp1 = 20. 2 = 400
P2:
Σp2 = Σp1 – 11 – 11
Σp2 = 400 – 11 – 11

Σp2 = 378
Xp2 = Σp2 /n2
O somatório de P2 é 378.
N2 = 20 – 2
N2 = 18
A população de P2 é 18.
378/18 = 21
A média de P2 é 21.
P1:
σ²= ( X²) – ( X²)2
36 = ( X²) – 400
( X²) = 436
Com a média do quadrado de P1, é possível encontrar o somatório do quadrado.
Σx²= n. X²
Σx²= 20. 436
Σx²= 8720
Com o somatório dos quadrados de P1, encontra-se o somatório do quadrado de P2:
Σx²= 8720 – (11)² – (11)²
Σp²= 8720 – 121 – 121
Σp²= 8478
Com a somatória do quadrado de P2 , encontra-se a média.
Xp2= 8478/18 = 471

Calcula-se a variância de P2:
σ²= X2 – ( X2)2
σ²= 471 – (21)2
σ²= 471 – 421 = 30
VR = 30/(21)² = 30/441

ÚLTIMAQUESTÃO DA AULA 26.

29
Q

Distribuição Simétrica

A

Graficamente, uma distribuição simétrica tem associada a si uma curva de frequências
unimodal apresentando duas “caudas” simétricas em relação a uma linha vertical que passa por seu ponto mais alto (eixo de simetria).

O ponto mais alto é a moda. A moda possui a maior frequência. O eixo vertical é o da frequência absoluta: quanto mais para cima, maior.

Se a moda for igual à mediana e igual à média aritmética, teremos uma distribuição simétrica. Isto é, 50% dos dados estão para um lado e 50% dos dados estão para o outro lado. Portanto, existe um equilíbrio.

30
Q

Distribuições Assimétricas (não Simétrica)

A

Uma distribuição assimétrica tem associada a si uma curva de frequências unimodal que
apresenta, a partir do seu ponto mais alto, uma “cauda” mais longa para a direita (assimetria
positiva) ou para a esquerda (assimetria negativa). A cauda determina a assimetria.
Nas distribuições assimétricas, os valores da moda, da mediana e da média divergem
sendo que a média sempre estará do mesmo lado que a cauda mais longa.

Sempre quem está no ponto mais alto é quem tem a maior frequência. Quem possui a
maior frequência é a moda. Portanto, a moda sempre estará no ápice.
* A média aritmética sempre estará nas caudas.
* A mediana sempre estará entre a moda e a média.
* Quem define a assimetria é a média. Se ela está à direita, há assimetria à direita; se
ela está à esquerda, há assimetria à esquerda.

Distribuição assimétrica negativa (à esquerda):
Mo < Md < x̅
Distribuição assimétrica positiva (à direita):
x̅ < Md < Mo

31
Q

Distribuição assimétrica negativa (à esquerda):
Mo < Md < x̅

A
32
Q

Distribuição assimétrica positiva (à direita):
x̅ < Md < Mo

A
33
Q

Entre a moda, a média e mediana, quem sofre mais influência dos extremos?

A

A média sofre maior influência dos extremos.

34
Q

É possível uma distribuição de frequência (com uma variável qualquer) sem ter moda?

A

Sim, é possível.

Diante dessa situação, só precisamos da média e da mediana. Se a média é maior quena mediana, a distribuição será assimétrica à direita; se a média for menor que a mediana, a
distribuição será assimétrica à esquerda.

35
Q

(CESPE/PCDF/ESCRIVÃO DE POLÍCIA) Em uma amostra com assimetria positiva, observa-se que a média é igual à moda e que a mediana está deslocada à direita da média. (CERTO/ERRADO)

A

ERRADO.

Se temos assimetria positiva, a média está à direita da mediana.
Perceba que nem foi preciso perder tempo com a moda.
Quem define a assimetria é a média. Se a média está à esquerda, a assimetria é negativa:

36
Q

(IFPA/2019) A variável aleatória Y apresenta as seguintes observações Y = {6; 14; 6; 14;
13; 8}. Assim, o coeficiente de variação e a assimetria seriam respectivamente:
a. 31,19% e assimetria negativa
b. 35,63% e assimetria negativa
c. 38,56% e assimetria positiva
d. 29,26% e assimetria positiva
e. 35,63% e assimetria positiva

A

Primeiramente, vamos tratar de assimetria. Para definir a assimetria, precisamos dos seguintes parâmetros: média e mediana.
Perceba que a questão não traz uma moda.
Para encontrar a mediana, precisamos colocar os valores em rol:
Md = {6, 6, 8, 13, 14, 14}
Se temos uma quantidade par de elementos, devemos pegar os valores centrais e calcular
a média aritmética:

Md = 8 + 13 / 2 = 10,5
A média aritmética será:
6 + 14 + 6 + 14 + 13 + 8 / 6 = 61 / 6 = 10,166…
Aqui, a média é menor do que a mediana. Se ela é menor, ela está à esquerda; se ela é
maior, ela está à direita. Se está à esquerda, haverá assimetria negativa.
Calculando o coeficiente de variação:
Cv = S / X = S / 10,166…
Calculando a variância:
S² = 2.(6 – 10,166…)² + 2.(14 - 10,166…)² + (8 - 10,166…)² + (13 - 10,166…)² / 6
S² = 34,7 + 29,38 + 4,69 + 10,02 / 6
S² = 78,79 / 6
S² = 13,13
S = √13,13 = 3,6 aproximadamente.
Portanto:
CV = 3,6 / 10,166… = 0,356. 100% = 35,6
Essas últimas contas realizadas serviram apenas para concluir a questão. No entanto, o
ponto central era definir o tipo de assimetria (à direita ou à esquerda).

Média = 10,16
Mediana = 10,5

Como a média é menor que a mediana, a assimetria está à esquerda (negativa).

37
Q

(CESGRANRIO) O Quadro abaixo contém medidas estatísticas a respeito de uma variável de interesse, a partir de uma amostra de N = 25 elementos, sendo Q1 e Q3 o primeiro
e o terceiro quartis da distribuição, respectivamente:

Com base nos dados obtidos, considere as afirmações a seguir.
I – O coeficiente de variação é de 20% com os dados considerados homogêneos.
II – 25% da informação obtida se situa entre 545 e 620.
III – A distribuição é assimétrica positiva.
IV – O valor de 520 divide a distribuição ao meio.

É correto o que se afirma em
a. I e II, apenas
b. III e IV, apenas
c. I, II e III, apenas
d. II, III e IV, apenas
e. I, II, III e IV

A

a. I e II, apenas

I – Calculando o coeficiente de variação:
CV = S / X = 104 / 520
CV = 1 / 5. 100% = 20%
II – De acordo com essa representação, entre Q2 e Q3 temos 25% da informação.
III – Quando falamos de assimetria, precisamos dos seguintes valores: mediana e moda.
Md = 545
X = 520
A média é menor que a mediana. Assim, a média está apontando para a esquerda. Logo,
teremos assimetria à esquerda (negativa).
X < Md
IV – O valor de 545 divide a distribuição ao meio.

38
Q

COEFICIENTES DE ASSIMETRIA (AS)

A

Um coeficiente de assimetria quantifica o desvio de uma distribuição em relação a uma distribuição simétrica e o sinal resultante do seu cálculo nos dá o tipo de assimetria da distribuição.
Nesse caso, o desvio pode ser à direita ou à esquerda. Para isso, é preciso observar o
sinal da fórmula é que irá identificar para qual lado ela está. Lembrando que, se observar
apenas a média e a mediana, é possível identificar se é assimétrica à direita ou à esquerda.
Ou seja, se for maior, ela estará à direita, mas se for menor, estará à esquerda.

39
Q

Coeficientes de Pearson

A

O segundo tem a média e a mediana sobre o desvio padrão. Sendo assim, para saber se
é assimétrica à direita ou à esquerda basta observar a mediana. Logo, se a média é maior
do que a mediana, assimetria positiva à direita. Já se a média é menor, será assimetria à
esquerda ou negativa.

40
Q

Coeficientes de Pearson

A

Teoricamente, o segundo coeficiente de assimetria de Pearson pode variar entre -3 e +3.
Na prática, porém, raramente ultrapassará os limites de -1 e +1 Os valores dos dois coeficientes de assimetria de Pearson serão iguais somente quando a distribuição for simétrica.
Quando a distribuição não tiver forte assimetria, o segundo coeficiente deverá ser usado preferencialmente ao primeiro.
O coeficiente de assimetria permite distinguir as distribuições assimétricas. Um valor negativo indica que a cauda do lado esquerdo da função densidade de probabilidade é maior que a do lado direito. Um valor positivo para a assimetria indica que a cauda do lado direito é maior que a do lado esquerdo. Um valor nulo indica que os valores são distribuídos de maneira relativamente iguais em ambos os lados da média, mas não implica necessariamente uma distribuição simétrica.

41
Q

(CESPE/CEBRAPE) A tabela apresenta as estatísticas produzidas em um levantamento
acerca do número diário de acidentes que envolvem motocicletas em determinado local.
Com base nessas informações, julgue os próximos itens.

I – O coeficiente de variação da distribuição em questão é superior a 1 e inferior a 1,4.
II – Segundo o coeficiente de assimetria de Pearson, a distribuição desse número diário
de acidentes apresenta assimetria negativa.
III – A variância da distribuição do número diário de acidentes com motocicletas no referido local é inferior a 100.

A

I – Coeficiente de Variação é o desvio padrão sobre a média aritmética.
Cv = 12/10
CV= 1,2
Nesse caso, 1,2 está entre 1 e 1,4.
II – Para definir qual o tipo de assimetria negativa da distribuição é preciso observar a média e a mediana, 10 e 8, respectivamente. Sendo assim, a média é maior que a mediana,
logo é assimétrica positiva. Se a banca solicitada o coeficiente, como não tem moda, o
cálculo deveria ser realizada utilizando o segundo modelo.
AS = 3( x̅ -Md)/S
AS = 3(10-8)/ 12
AS = 6/12
AS = 0,5 = 50%

Como o resultado foi positivo será assimétrica à direita.
III – Lembrando que variância é S2.
S2
= (12)2
= 144
Ou seja, é superior a 100.

42
Q

(CONSULPLAN/TSE/ANALISTA JUDICIÁRIO/ESTATÍSTICA) A variável X apresenta as
seguintes observações X = {6; 4; 6; 4; 3; 8; 7; 9; 2; 6}. Assim, o desvio-padrão dessas
observações é 6,67. Pelo segundo coeficiente de assimetria de Pearson (o que compara
média e mediana), o coeficiente de assimetria é:
a. 0,075.
b. – 0,075.
c. – 0,225.
d. – 1,245.

A

c. – 0,225.

x̅ = 6 + 4 + 6 + 4 + 3 + 8 + 7 + 9 + 2 + 6 / 10 = 5,5
Md = 6

AS = 3(5,5 - 6) / 6,67
AS = 0,225

43
Q

(CESPE/CEBRASPE) A tabela precedente apresenta a distribuição de frequências relativas da variável X, que representa o número diário de denúncias registradas na ouvidoria de determinada instituição pública.

A partir das informações dessa tabela, julgue o item seguinte.
1) A amplitude total da amostra é igual ou superior a 5.
2) A variável X é do tipo qualitativo nominal.
3) A moda da variável X é igual a 2.
4) A variância de X é inferior a 2,5.
5) A distribuição da variável X é simétrica em torno da média.
6) A mediana do número diário de denúncias registradas é igual a 2.

A

Quanto à frequência relativa, se desejar pode transformar em porcentagem. Porém, se
desejar deixar com a vírgula, não terá influência no resultado.
1. A amplitude é a diferença entre o maior e o menor valor da amostra. Nesse caso, o
menor valor da amostra é 0 denúncias e o maior é 4 denúncias registradas diariamente.
A = 4 - 0 = 4
Portanto, a amplitude não é igual ou superior a 5.
2. O número de diário de denúncias registradas é a variável, a qual está dando quantidade a ele. Por isso, não poderá ser qualitativa nominal. Nesse sentido, quanto às denuncias, não há valor entre, por exemplo, 1 e 2, ou seja, cabe apenas números interiores.
Portanto, é quantitativa discreta.
3. Ela não possui moda, porque é uma distribuição bimodal, em que há 0 denúncias e 4
denúncias.
4. Para encontrar a variação de X, antes precisa encontras a média.
Nesse caso, ao invés de trabalhar com números decimais, pode-se multiplicar por 10. Ou seja,
x̅ = ((0x3) + (1x1) + (2x2) + (1x3) + (3x4) / 10
x̅ = 2
Sendo assim, é possível observar que a média denúncia registrada na ouvidoria de determinada instituição pública é de 4 por dia. Nessa hipótese, é preciso identificar se está se trabalhando com a população ou com a mostra. Se for população são 10 dias, mas,
se for uma mostra, é 10 - 1.
S² = (3x(0 - 2) + 1x(1 - 2) + 2x(2 - 2) + 1x(3 - 2) + 3x(4 - 2)) / 10 -1
S² = 2,88
Portanto, a variância é superior a 2,5.
5. Lembrando que para ser simétrica a média precisa ser igual a mediana. Se quiser
fazer a frequência acumulada, os elementos utilizados serão o quinto e o sexto. Porém,
não há necessidade. Observando a tabela da frequência relativa, é possível identificar
que existem quatro elementos antes, quatro depois e o 2 no meio. Logo, a mediana é 2.
6. A mediana, nesse caso, é 2.

44
Q

(CESPE/CEBRASPE/DEPEN/AGENTE PENITENCIÁRIO FEDERAL/ÁREA 4) Felipe M. Monteiro, Gabriela R. Cardoso e Rafael da Silva. A seletividade do sistema
prisional brasileiro e as políticas de segurança pública. In: XV Congresso Brasileiro de
Sociologia, 26 a 29 de julho de 2011, Curitiba (PR). Grupo de Trabalho – Violência e Sociedade (com adaptações).
A tabela precedente apresenta a distribuição percentual de presos no Brasil por faixa
etária em 2010, segundo levantamento feito por Monteiro et al. (2011), indicando que a
população prisional brasileira nesse ano era predominantemente jovem.
Com base nos dados dessa tabela, julgue o item a seguir.
A distribuição percentual de presos no Brasil em 2010 exibe assimetria à esquerda (ou
assimetria negativa), o que permite sugerir que a população prisional brasileira nesse ano
tenha sido predominantemente jovem. (CERTO/ERRADO)

A

ERRADO.

Lembre-se de que idade é uma variável quantitativa continua, porque entre 10 e 11 anos
posso ter 10 anos e tantos meses. Para o poder qualificar e especificar o tipo de assimetria
com relação à distribuição, é preciso analisar duas estimativas, da média e da mediana.
Além disso, deve-se encontrar o ponto médio da classe.
Para isso, por exemplo, no caso de 18 a 25 anos, somam-se ambos e divide por dois,
resultando em 21,5.
Na segunda classe, de 25 a 30 anos, o resultado é 27,5.

Já na terceira classe, de 30 a 35 anos, é 32,5.
Enquanto na quarta classe, de 35 a 45 anos, é de 40.
E, por fim, na quinta classe, de 45 a 60 anos, o ponto médio é 52,5.
Observe que as classes não possuem a mesma amplitude.

x̅ = (30x21,5) + (25x27,5) + (20x32,5) + (15x40) +(10x52,5) / 100
x̅ = 31,075

Com isso, é possível observar que a idade média da população prisional é 31,075. Na sequência, para encontrar a classe mediana será calcular a frequência acumulada.

A classe mediana está na frequência acumulada e já em rol. Logo, verifica-se que até o 30º preso a idade é entre 18 e 25 anos. Do 31º ao 55º preso, se passou pelo meio. Se foi simulado 100 presos, o do meio estará entre 50 e 51, sendo que esse está na segunda classe, de 25 a 30 anos. Portanto, a mediana será de 25 a 30, isto é, não chega a 31,07.
Conclui-se então, que a média é maior que a mediana, sendo assim ela está assimétrica
à direita, é positiva.

45
Q

CURTOSE

A

Denomina-se curtose ao grau de “achatamento” de uma distribuição de frequências,
geralmente unimodal, medido em relação ao de uma distribuição normal (de Gauss) que é
tomada como padrão. Muito embora seja comum explicar a curtose como o “grau de achatamento” de uma distribuição de frequências, o que as medidas de curtose buscam indicar realmente é o grau de concentração de valores da distribuição em torno do centro desta distribuição. Numa distribuição unimodal, quanto maior for a concentração de valores em torno
do centro da mesma, maior será o valor da sua curtose.

46
Q

CURTOSE: Tipos de distribuição de frequências

A

Dizemos que uma distribuição de frequências é:
* Mesocúrtica – quando apresenta uma medida de curtose igual à da distribuição normal;
* Platicúrtica – quando apresenta uma medida de curtose menor que a da distribuição normal;
* Leptocúrtica – quando apresenta uma medida de curtose maior que a da distribuição normal.

A distribuição Platicúrtica vem de platô, algo mais reto, isto é, mais baixa que a Mesocúrtica. Já Leptocúrtica apresenta maior curtose, ou seja, uma concentração maior. Lembre-se que, sempre que os valores estiverem mais dispersos, a curva é mais baixa, consequentemente, a curtose é menor, e vice-versa.

47
Q

COEFICIENTE PERCENTÍLICO DE CURTOSE

A

Este coeficiente é definido como o quociente entre a amplitude semi interquartílica e a
amplitude entre o 10º e o 90º percentis. Lembrando-se que Q3 – Q1 corresponde a amplitude interquartílica. Todavia, nesse caso, trata-se de semi interquartílica, ou seja, semi dá ideia de metade.

Vale frisar que o Coeficiente Percentílico de Curtose é encontrado a partir das separatrizes, ou seja, decis, centis e quartis. Na estatística, a curva normal não trabalha com a distribuição de frequência, e sim trabalhar com a distribuição de probabilidades.
O valor deste coeficiente para a curva normal é 0, 26367… Assim sendo, ao calcularmos
o coeficiente percentílico de curtose de uma distribuição qualquer teremos:
* Quando Cp ≅ 0,263 →diremos que a distribuição é mesocúrtica;
* Quando Cp < 0,263 →diremos que a distribuição é platicúrtica;
* Quando Cp > 0,263 →diremos que a distribuição é leptocúrtica.

48
Q

COEFICIENTE PERCENTÍLICO DE CURTOSE

A

ATENÇÃO!!!

É importante frisar que, se na questão tiver em decis, a fórmula também mudará.

49
Q

COEFICIENTE PERCENTÍLICO DE CURTOSE

A
  • Quando Cp ≅ 0,263 →diremos que a distribuição é mesocúrtica;
  • Quando Cp < 0,263 →diremos que a distribuição é platicúrtica;
  • Quando Cp > 0,263 →diremos que a distribuição é leptocúrtica.

Na estatística, a curva normal não trabalha com a distribuição de frequência, mas com a
distribuição de probabilidades. Quando se calcula esse Coeficiente Percentílico de Curtose e
o valor não é igual, mas aproximado a 0,263, isso corresponde à distribuição normal, ou seja,
a Curva de Gaus. Logo, ela é mesocúrtica. Já se o resultado for maior que 0,263, será platicúrtica; se for menor que 0,263, será lepticúrtica. Nesse sentido, é preciso compreender que na mesocúrtica, há concentração dos valores no centro da distribuição. Na platicúrtica, não
existe uma grande concentração, já na lepticúrtica,a concentração é grande e a curva sobe.
Obs.: o Desvio Quartílico mede a Concentração das Observações em torno da Mediana.
Lembrando que, nesse caso, a mediana é o Q2.

FÓRMULA: (Q3-Q1)/2

50
Q

(CESPE/CEBRASPE) A tabela de frequências do número X diário de falhas registradas
na versão beta de um sistema operacional é mostrada abaixo:

Com base nessa tabela, julgue os itens a seguir.
1) O número médio diário de falhas registradas foi superior a 1,4 falha por dia.
2) A mediana e a moda de X são iguais, e a distribuição do número diário de falhas
registradas é simétrica em torno de 1.
3) Considerando hipoteticamente que uma empresa de consultoria e marketing tenha
proposto um indicador Y que expressa os prejuízos à imagem do fabricante do software devido às ocorrências das falhas, em que Y = 10 – 0,1X, nessa situação, a
variância de Y será igual a 1% da variância de X.
4) Em 2% dos dias de observação, não foram registradas falhas na versão beta do
sistema operacional.
5) Considerando que a probabilidade de que o sistema operacional registre mais de
10 falhas em um dia seja igual a 0,001, será correto esperar que, ao longo de 300
dias, em pelo menos 2 dias sejam registradas mais de 10 falhas diárias desse sistema operacional.

A

Item 1- Cálculo da média aritmética
x̅ = ((0x60) + (1x100) + (2x80) + (3x50) + (4x10))/300
x̅ = 1,5 falhas por dia
(CERTO)

Item 2- Cálculo da mediana
Calcula-se a frequência acumulada (Fac)
Até o elemento 60, o 0 é a variável. De 61 até 160, a variável é 1. A mediana está depois
do 60 e antes do 160 (intervalo entre 150, 151). Nesse intervalo só está o número 1, então a mediana é 1 falha por dia.
Obs.: o cálculo da Fac auxilia na busca por determinado elemento no rol quando os valores
estão em ordem.
Em relação à simetria, observa-se que a média é maior e, nesse sentido, está mais para
a direita. Assim, a média é maior que a mediana e a distribuição fica assimétrica à direita.
Percebe-se que a mediana é 1 e a moda também é 1. Quando a questão abordar simetria recomenda-se calcular a média e a mediana para poder julgar o resultado.
Na resposta do item poderia haver erro se apenas o valor da mediana e da moda fossem
considerados, pois o cálculo da média mostrou que a distribuição é assimétrica.
Obs.: o resultado também poderia ser obtido por meio do coeficiente de assimetria de Pearson: 1º coeficiente de assimetria = compara a moda e a média, 2º coeficiente de assimetria = compara a média e a mediana.
(ERRADO)

Item 3- Y representa o prejuízo à imagem do fabricante do software. X representa as falhas (ver tabela). Portanto, a imagem está em função da quantidade de falhas.
Para resolver o item é necessário calcular a variância de Y.
Y = 10 – 0,1X
Aplica-se a variância tanto em Y quanto em X:
S²Y =10 – 0,1(S²X)
Porém, somar ou subtrair uma constante a uma variância faz com que ela fique inalterável. Assim, somar o 10 não provoca alteração e multiplicar uma constante é o mesmo que multiplicar pelo quadrado da constante.
S²Y =(0,1)² · (S²X)
S²Y =0,01 · S²X
S²Y =1 % S²X
(CERTO)

Item 4-
Dias em que não houve falhas: 60
Total de dias: 300
60/300 = 0,2 = 20%
(ERRADO)

Item 5
0,001x300 = 0,3
0,3 é menor que 1
(ERRADO)

51
Q

(CONSULPLAN/TRF-2ª REGIÃO/ANALISTA JUDICIÁRIO/ESTATÍSTICA) Sobre medidas
de posição, medidas de dispersão, assimetria e curtose, assinale a alternativa INCORRETA.
a. A curtose é interpretada com base na distribuição normal.
b. No gráfico boxplot, os outliers são os pontos a 3 desvios-padrões de distância da média.
c. A distribuição qui-quadrado tende a ficar simétrica com o aumento dos seus graus de
liberdade.
d. Para um conjunto de dados positivos com pelo menos dois valores diferentes entre si
tem-se que a média harmônica é menor que a média geométrica e a média geométrica
é menor que a média aritmética.

A

LETRA B

a. A curtose usa a curva normal.
b. O gráfico boxplot é o gráfico em caixas. Outliers são os valores atípicos:
Limite inferior: Q1 – 1,5 (Q3 – Q1);
Limite superior: Q3 + 1,5 (Q3 – Q1).
d. x̅ h ≤ x̅ g ≤ x̅ A.

52
Q

(CESPE/FUB/ESTATÍSTICO) O conceito médio da graduação (G) é um indicador calculado pelo INEP (Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira) para a avaliação da qualidade
dos cursos de graduação das instituições de ensino superior. A figura apresentada mostra, esquematicamente, as distribuições desse indicador nas instituições privadas e públicas, referentes ao ano de 2013, e a tabela apresenta algumas estatísticas descritivas
referentes a essas distribuições.
Com base nessas informações, julgue o próximo item.
O coeficiente percentílico de curtose da distribuição do indicador G nas instituições privadas é inferior ao coeficiente percentílico de curtose desse mesmo indicador nas instituições públicas. (CERTO/ERRADO)

A

ERRADO.

Calcula-se a coeficiente percentílico cuja fórmula é:
PÚBLICA
CP = ((Q3-Q1)/2) / D9-D1
CP = ((3,1-2,5)/2) / 3,4-2,3
CP = 3/11

PRIVADA
CP = ((Q3-Q1)/2) / D9-D1
CP = ((2,9-2,3)/2) / 3,1-2,2
CP = 3/9

3/9 > 3/11

53
Q

(2019/UFAC/UFAC/ESTATÍSTICO) Considere o modelo de regressão linear simples clássico Yi = α + βxi + ei, em que Yi é a variável resposta, xi a variável preditora e ei são os
erros supostamente normais, independentes, com média zero e variância constante. Suponha que num determinado experimento foram obtidas amostras de pares xi,Yi e para
tal, um processo de estimação por mínimos quadrados encontrou estimativas pontuais
para os parâmetros α e β (supostamente fixos e constantes). Sabe-se que neste tipo de
estimação, é importante que seja realizado uma análise nos resíduos obtidos a partir
destas estimativas para o modelo, visto que isso pode indicar possíveis violações das
pressuposições básicas do modelo proposto. Abaixo apresentamos um gráfico do tipo
Box-Plot, que foi realizado nos resíduos obtidos a partir da amostra em questão:

A

LETRA C.

a. Os erros são dependentes.
b. Ao observar o gráfico, percebe-se que a distribuição é assimétrica.
c. Ao observar o gráfico, pode-se interpretar que a cauda está na direção da direita.