Estatística Descritiva: Medidas de Variância ou Dispersão Flashcards
Medidas de variação ou dispersão
MEDIDAS DE DISPERSÃO
Dispersão passa a ideia de algo que se afasta. Nesse caso, afasta-se da média aritmética.
MEDIDAS DE POSIÇÃO
As medidas de posição (média, mediana, moda) descrevem apenas uma das características dos valores numéricos de um conjunto de observações, o da tendência central.
Porém nenhuma delas informa sobre o grau de variação ou dispersão dos valores observados. Em qualquer grupo de dados, os valores numéricos não são semelhantes e apresentam
desvios variáveis em relação a tendência geral de média. Isto é, em um grupo de dados, os
números não são tão semelhantes, podendo ser possível perceber uma variação. Por exemplos, as notas de um simulado ou o desempenho de alguns funcionários público em uma
prova de capacitação.
Portanto é importante perceber não somente a média, porque esta sofre influência dos
extremos, mas também os desvios das variáveis em relação à tendência geral da média.
As medidas de dispersão servem para avaliar o quanto os dados são semelhantes, descreve, então, o quanto os dados distam do valor central. Desse jeito, as medidas de dispersão servem também para avaliar qual o grau de representação da média, isto é, se a média
é 5, sabe-se que pode haver pessoas que tiraram uma nota 0 ou uma nota 10, mas se o
desvio-padrão é 5, sabe-se que, da média para baixo, é mais ou menos 2, e da média para
cima, é dois para cada lado. É aquilo que desvia da média. Então, o desvio-padrão vai além
da média aritmética. Ele mostra a variação, aquilo que destoa do que seria um padrão.
A variação é quando se tem a média, mas se percebe que há alguns desvios (d1, d2,
d3, d4, d5, d6, d7). Mesmo que o desvio seja igual a média, haverá um desvio zero. A soma
desses desvios é igual a zero. Essa é uma propriedade importante.
d1+ d2 + d3 + d4 + d5 + d6 + d7 = 0
O desvio é:
d= (Xn - x̅)
É fácil demonstrar que apenas a média é insuficiente para descrever um grupo de dados.
Dois grupos (ou mais) podem ter a mesma média, mas serem muito diferentes na amplitude
de variação de seus dados. Por exemplo:
* Grupo A (dados observados): 5; 5; 5.
* Grupo B (dados observado): 4; 5; 6.
* Grupo C (dados observados): 0; 5; 10.
A média, por si só, não demonstra uma realidade, não caracteriza o grupo.
Imagine que o exemplo acima seja de uma capacitação de funcionários. Em cada grupo,
há três pessoas. No grupo A, todos tiraram 5, então a média é 5 e, nos grupos B e C, a média
também foi cinco. Contudo, os três grupos não possuem as mesmas características. Não
será possível avaliar esses profissionais da mesma maneira, já que as notas foram muito
diferentes.
Escolher um profissional que tirou zero não será o mesmo que escolher um profissional
que tirou 10. É por isso que o desvio-padrão é importante, porque caracteriza melhor o grupo.
Caso se falasse apenas das médias, seria possível ter a impressão de que os grupos
são semelhantes. Contudo, quando se sabe o desvio-padrão, percebe-se que eles não são
semelhantes. O desvio no grupo A é zero. O desvio no grupo C é bem maior, porque as notas
são totalmente heterogêneas. O grupo A é mais homogêneo.
A média dos três grupos é a mesma (5), mas no grupo “A” não há variação entre os dados,
enquanto no grupo “B” a variação é menor que no grupo “C”. Dessa forma, uma maneira mais
completa de apresentar os dados (além de aplicar uma medida de tendência central como a
média) é aplicar uma medida de dispersão.
Quais são as medidas de variação?
Determina a característica de variação ou dispersão de um conjunto de dados:
1. Amplitude
2. Desvio
3. Desvio médio ou desvio absoluto
4. Desvio padrão
5. Variância
ATENÇÃO:
O importante é saber que:
* a amplitude total é o menor e maior valor da amostra.
* a soma dos desvios é igual a zero.
* a soma dos quadrados é a soma dos quadrados dos desvios.
* a variância amostral é a soma dos desvios ao quadrado sobre n menos 1.
* a variância populacional é o somatório dos desvios ao quadrado sobre N.
* o desvio-padrão amostral será a raiz quadrada de S² e o desvio padrão populacional
será a raiz quadrada da variância. Isto é:
Amplitude
Diferença entre o maior e o menor valor. Subtraia o menor valor do maior.
Amplitude = 1,88 – 1,60 = 0,28 m
Desvio e desvio absoluto
Desvio
* Diferença entre cada valor e a média
Desvio médio ou absoluto
* Média dos desvios em termos absolutos
ΣIx- x̅I / n
Obs.: as barras indicam o módulo, para
que todos fiquem positivos. Caso contrário, a soma dos desvios seria zero.
Obs.: o desvio pode dar positivo ou negativo. Isso depende de ele estar acima ou abaixo da média. Quando está acima da média, é positivo e, quando está abaixo, é negativo. É por isso que a variância (S²) é elevada ao quadrado, isto é, para resolver esse problema de ser negativo.
Desvio-padrão
Medida da variação dos valores em relação à média.
Ex.: calcular o desvio-padrão do conjunto de dados ao lado.
Passo 1: calcule a média;
Passo 2: calcule o DEVIO de cada medida sobre a
média
Desvio = x- x̅
Calcule o desvio-padrão do conjunto de dados
ao lado.
Passo 3: eleve ao quadrado cada uma das
diferenças;
Passo 4: some todos os quadrados obtidos
Σ(x- x̅)²
Passo 5: divida o total por (n-1), onde n é o número de dados coletados (amostra);
Passo 6: extraia a raiz quadrada do resultado anterior
Desvio padrão = √Σ(x- x̅)² / n-1
A variância é quando se pega cada desvio e soma. Contudo dois desvios podem ser
negativos. Uma ferramenta, além do módulo, para transformá-los em positivo é elevar ao
quadrado.
S² = Σ(x- x̅)² / n-1
Observação: a unidade do desvio-padrão é a mesma unidade dos valores originais ou
conjunto de dados.
Fórmula extra de variância
A variância pode ser a média dos quadrados menos o quadrado das médias.
O uso de cada fórmula vai depender do que a questão do concurso traz. Muitas vezes, a
questão não traz os valores apresentados nas tabelas acima. Muitas vezes, a banca afirma
que o quadrado da média é de um valor x e a média dos quadrados é y. Nesse caso, utilize
esta segunda fórmula da variância.
Exemplo:
X – = {1,2,3}
Qual a diferença de desvio padrão e variância?
O desvio-padrão é a raiz quadrada da variância: Ou, de forma similar, a variância é o quadrado do desvio-padrão.
Desvio padrão = √Σ(x- x̅)² / n-1
S² = Σ(x- x̅)² / n-1
COEFICIENTE DE VARIAÇÃO
O Coeficiente de Variação indica a magnitude relativa do desvio-padrão quando comparado à média do conjunto de valores.
O Coeficiente de Variação é útil para compararmos a variabilidade (dispersão) de dois
conjuntos de dados de ordem de grandezas diferentes.
COEFICIENTE DE VARIAÇÃO
Exemplo prático
Seja o seguinte conjunto de preços de geladeiras em 7 lojas distintas.
Seja o seguinte conjunto de preços de liquidificadores nas mesmas lojas acima.
Qual dos produtos têm uma maior variabilidade de preços?
Pelo coeficiente de variação, consegue-se avaliar duas grandezas diferentes: carros
novos e carros usados, produtos enlatados e produtos orgânicos etc.
Uma vez que, em geral, uma geladeira custa bem mais que um liquidificador, a tendência
é que o desvio-padrão da geladeira seja também maior.
O coeficiente de variação é uma medida adimensional que normaliza o desvio-padrão em
relação à média. A média e o desvio-padrão possuem a mesma unidade de medida. É por
isso que, muitas vezes, aparece em porcentagem. Não há unidade de medida.
CV(gel) = 25,63/787,14
CV(gel) = 3,3%
CV(liq) = 4,81/49,14
CV(liq) = 9,8%
Com o CV podemos concluir que os preços da geladeira têm uma menor variabilidade que os do liquidificador. Os preços das geladeiras variam menos, com relação à média, que os do liquidificador.
(UFAC/ESTATÍSTICO/2019) Um estudo foi desenvolvido com uma espécie de cupuaçu
devido a sua importância socioeconômica para região Amazônica. Uma das variáveis
estudadas tinha um caráter quantitativo contínuo, “Altura de Parte Aérea” – APA, em
milímetros (mm). Abaixo dispomos uma amostra das APA de 10 plantas após 45 dias de
experimento:
* Amostra (mm): 8; 14; 20; 9, 11; 13; 8; 11; 20;13.
* Com base nessas informações amostrais, tem-se o seguinte resumo descritivo:
– Valor Mínimo: 8; 1º Quantil: 9,5; Mediana: 12; Média: 12,7; 3º Quantil: 13,7;
– Valor Máximo:20; Desvio-padrão: 4,3.
Dessa forma, é correto afirmar que o coeficiente de variação é:
a. 12,00%.
b. 4,25%.
c. 12,70%.
d. 33,86%.
e. 290,35%
PROPRIEDADES DO DESVIO-PADRÃO E DA VARIÂNCIA
- Somando-se (ou subtraindo-se) a cada elemento uma constante qualquer, o Desviopadrão e a Variância não se alteram.
- Multiplicando-se (ou dividindo-se) cada elemento por uma constante qualquer:
2.1. O desvio-padrão fica multiplicado (ou dividido) por essa constante;
2.2. A variância fica multiplicada (ou dividida) PELO QUADRADO dessa constante.
Por exemplo, se há um conjunto de valores de alturas e a estas se somam 5 centímetros,
o desvio e variância não se alteram. Por outro lado, se cada uma das alturas for multiplicada
ou dividida por dois, por exemplo, o novo desvio-padrão também estará multiplicado por
dois. No caso da variância, o novo desvio-padrão estará multiplicado pelo quadrado dessa
constante. Assim, se as alturas foram multiplicadas por dois, a variância será multiplicada pelo quadrado de dois, que é quatro.
(UFU-MG/UFU-MG/TÉCNICO EM ESTATÍSTICA/2019) Considere que o coeficiente de
variação de uma amostra de preços dos aluguéis na cidade de Uberlândia em 2018 foi de 80%. O IGPM indica que, para 2019, os preços devem ter uma retração de 10%.
Se os aluguéis dessa amostra forem reajustados, conforme o IGPM, o novo coeficiente de variação será de:
a. 64%
b. 80%
c. 70%
d. 16%
b. 80%
O coeficiente que está variando. Entre a média e o desvio-padrão foi de 80%. Então, há
aluguel barato e aluguel caro.
Quando se diminui 10% de alguma coisa, é multiplicar por 0,9. Cuidado! Não é subtrair.
Portanto, a constante é a multiplicação de 0,9.
Essa multiplicação não vai mudar nada, porque 0,9 corta 0,9 e sobrará a mesma coisa de
2018. O coeficiente de variação permanece o mesmo.
(FCC/PREFEITURA DE RECIFE/PE/ANALISTA DE GESTÃO ADMINISTRATIVA/2019)
Considere uma população P formada por números estritamente positivos. Com relação
às medidas de tendência central e de dispersão é correto afirmar que
a. multiplicando todos os elementos de P por 16, o desvio-padrão da nova população é
igual ao desvio-padrão de P multiplicado por 4.
b. dividindo todos os elementos de P por 2, a variância da nova população é igual a
variância de P multiplicada por 0,25.
c. adicionando uma constante K > 0 a todos os elementos de P, a média aritmética e a
variância da nova população formada são iguais a média aritmética e desvio-padrão de
P, respectivamente.
d. a variância e o desvio-padrão de P são iguais somente no caso em que todos os
elementos de P são iguais.
LETRA B.
a. Se multiplicar por 16, o novo desvio-padrão também fica multiplicado por 16.
b. A variância da nova população fica dividida por 2², que é o mesmo que multiplicar por
¼, isto é, multiplicar por 0,25.
c. Se está somando, a média altera. O desvio-padrão e a variância não se alteram, mas
a média, sim.
d. Pode-se ter valores diferentes.
e. O desvio-padrão não se altera quando se subtrai. A média, por outro lado, pode sim
alterar.
(FADESP/UEPA/TÉCNICO DE NÍVEL SUPERIOR/ESTATÍSTICA/2020) Sejam X e Y
duas variáveis quaisquer e definamos X = Y + K. Então, com relação ao Coeficiente de
Variação, pode-se afirmar que
a. CV(X) < CV(Y), se k< 0
b. CV(X) = CV(Y), se k<0
c. CV(X) < CV(Y), se K>0.
d. CV(X) > CV(Y), se k>0.
c. CV(X) < CV(Y), se K>0.
(UFAC/ESTATÍSTICO/2019) Analise as seguintes assertivas:
I – A moda e o desvio-padrão são medidas de dispersão,
II – O desvio médio e a média são medidas de dispersão,
III – O coeficiente de variação e a variância são medidas de dispersão,
IV – A moda, a média e o desvio-padrão são medidas de posição.
Pode-se afirmar que estão corretas:
a. Apenas i. e ii.
b. Apenas ii. e iii.
c. Apenas iii.
d. Apenas iv.
e. Apenas i. e iv.
c. Apenas iii.
(FCC/BANRISUL/ESCRITURÁRIO/2019) Uma população é formada por 4 elementos,
ou seja, {4, 5, 5, 8}. O coeficiente de variação, definido como o resultado da divisão do
respectivo desvio-padrão pela média aritmética da população, é igual a
a. 3/11.
b. 9/22.
c. 3/22.
d. 9/11.
e. 1/5.
a. 3/11.
- Encontra a média;
- Calcula a variância;
- Encontra o desvio aplicando a raiz no valor da variância.
- Calcula o CV que é o desvio dividido pela média.
Média = (4+5+5+8)/4 = 11/2
Variância = (4²+5²+5²+8²)/4 - (11/2)² = 9/4
Desvio = √9/4 = 3/2
CV = (3/2) / (11/2) = 3/11
(VUNESP/TJ-SP/ADMINISTRADOR JUDICIÁRIO/2019) Os salários de todos os
160 funcionários de uma determinada carreira de nível médio em um órgão público
apresentam um coeficiente de variação igual a 20%. Sabe-se que a soma dos valores
desses salários elevados ao quadrado é igual a 4.160x(R$ 1.000,00)².
O valor do respectivo desvio-padrão é então igual a:
a. R$ 1.000,00
b. R$ 1.200,00
c. R$ 800,00
d. R$ 720,00
e. R$ 1.500,00
a. R$ 1.000,00
AULA 24 REVER A QUESTÃO LÁ.
(CESGRANRIO/PETROBRÁS/ANALISTA DE COMERCIALIZAÇÃO E LOGÍSTICA JÚNIOR/TRANSPORTE MARÍTIMO) A média dos salários dos funcionários de uma empresa é R$ 4.000,00, e o desvio padrão, R$ 1.000,00. O reajuste dos salários desses funcionários será realizado em duas etapas. Na primeira etapa, o reajuste será de 5% incidindo
sobre o salário inicial e, depois de um determinado período, haverá novo reajuste de 5%
incidindo sobre o salário já reajustado. Ao final das etapas de reajustes salariais, a variância dos salários será a variância dos salários iniciais, multiplicada por:
a. 1.
b. 1,05.
c. 1,05 elevado a 2
d. 1,05 elevado a 3
e. 1,05 elevado a 4
.
e. 1,05 elevado a 4
+5% = 100% + 5% = 105%
105/100 = 1,05
Para aplicar um reajuste de 5%, basta multiplicar por 1,05, o que resultará no montante
com o aumento de 5%.
É necessário observar as propriedades. Aumentar 5% é o mesmo que multiplicar todos
os salários, individualmente, por 1,5. Ao multiplicar o conjunto de valores por uma constante, o desvio padrão será multiplicado pela constante e a variância será multiplicada
pelo quadrado da constante.
No caso de soma, a resposta seria 1, mas para aumentar 5%, deve-se multiplicar por 1,05.
O número 1 representa o valor principal e o número,05 é o ajuste sobre o valor principal.
A operação, portanto, não é de soma, mas de multiplicação. Utiliza-se a propriedade da
variância. Ao multiplicar os valores por 1,05, a variância será multiplicada pelo quadrado
da constante (1,05).
K = 1,05
1º Reajuste: Salário. (1,05)²
Após um determinado período, há um novo reajuste de 5%.
2º Reajuste: S. (1,05)² x (1,05)²
Conserva a base e soma os expoentes.
S x (1,05)² x (1,05)²
= (1,05) elevado a 4
A variância dos salários será a variância inicial multiplicada por 1,05 elevado a 4.
.
(2018/CESGRANRIO/BANCO DO BRASIL/ESCRITURÁRIO) Há dez anos a média das
idades, em anos completos, de um grupo de 526 pessoas era de 30 anos, com desvio
padrão de 8 anos.
Considerando-se que todas as pessoas desse grupo estão vivas, o quociente entre o
desvio padrão e a média das idades, em anos completos, hoje, é:
a. 0,45
b. 0,42
c. 0,20
d. 0,27
e. 0,34
c. 0,20
O quociente entre o desvio padrão refere-se ao coeficiente de variação.
Cv = S/ X
Cv = 8/30 (antes, -10 anos)
Soma-se 10 anos ao desvio padrão e à média aritmética. Isso gera consequências diferentes, pois o desvio padrão é inalterável.
Cv = 8/(30 + 10)
Cv = 8/40
Cv= 1/5 = 0,2
(CESGRANRIO/PETROBRÁS/PROFISSIONAL JÚNIOR/ENGENHARIA DE PRODUÇÃO) Uma série com os últimos 50 preços do barril de petróleo apresenta uma média aritmética equivalente a 100 dólares americanos e uma variância de 25 dólares ao quadrado. O coeficiente de variação dessa amostra equivale a:
a. 0,05
b. 0,25
c. 1
d. 4
e. 20
a. 0,05
A unidade da variância sempre deve ser elevada ao quadrado. O desvio padrão é a unidade original.
X = 100,00
S² = 25,00
Cv = S/ X
S² = 25
D = √S = √25
D = 5
Cv = 5/100 = 0,05
(CESGRANRIO/EPE/ANALISTA DE PESQUISA ENERGÉTICA/PETRÓLEO ABASTECIMENTO) Uma amostra de tamanho 6 extraída de uma população de interesse forneceu os seguintes resultados:
1, 4, 5, 5, 7 e x.
Se o valor da média amostral é 2x, os valores da mediana amostral e da variância amostral são, respectivamente:
a. 4,5 e 4,8
b. 4,5 e 4
c. 5 e 4
d. 5 e 4,8
e. 5 e 5
a. 4,5 e 4,8
A mediana amostral é a medida de posição que é a principal separatriz (em 50%).
X = 1 + 4 + 5 + 5 + 7 + x/6
1 + 4 + 5 + 5 + 7 + x/6 = 2x
22 + x = 12x
11x = 22
X = 22/11
X= 2
Md = (1, 2, 4, 5, 5, 7)
Md = 4 + 5/2 = 4,5
É importante lembrar do fator de correção n – 1. Usa-se a forma convencional.
A média é 2x, ou seja, 4.
X = 4
S² =(1 – 4)² + (4 – 4)² + 2 (5 – 4) + (7 – 4)² + (2-4)²/6-1
S² = (9 + 2 + 9 + 4)/5
S² = 24/5 = 4,8
(2019/FCC/PREFEITURA DE RECIFE-PE/ANALISTA DE GESTÃO ADMINISTRATIVA)
Considere uma população P formada por números estritamente positivos. Com relação
às medidas de tendência central e de dispersão é correto afirmar que:
a. multiplicando todos os elementos de P por 16, o desvio padrão da nova população é
igual ao desvio padrão de P multiplicado por 4.
b. dividindo todos os elementos de P por 2, a variância da nova população é igual a variância de P multiplicada por 0,25.
c. adicionando uma constante K > 0 a todos os elementos de P, a média aritmética e a
variância da nova população formada são iguais a média aritmética e desvio padrão de
P, respectivamente.
d. a variância e o desvio padrão de P são iguais somente no caso em que todos os elementos de P são iguais.
e. subtraindo uma constante K > 0 de todos os elementos de P, o desvio padrão e a média aritmética da nova população são iguais ao desvio padrão e média aritmética de P
subtraídos de K, respectivamente.
LETRA B
a. Ao multiplicar todos os elementos por 16, o desvio padrão também será multiplicado
por 16. Se os elementos fossem somados por 16, o desvio padrão não sofreria alteração,
pois somar ou subtrair não altera o desvio padrão, apenas multiplicar e dividir.
b. Ao dividir os elementos por 2, a variância será dividida pelo quadrado de 2.
1/22
= 1/4 = 0,25
Dividir por 4 é equivalente a multiplicar por 0,25. Portanto, ao dividir por 2, a nova variância será dividida pelo quadrado de 2, que é 4 e equivale à multiplicação por 0,25.
c. Ao somar uma constante maior que zero a todos os elementos de P, a média aritmética será alterada, mas o desvio padrão será igual. A média aritmética será também somada à constante.
d. É possível haver uma variância de valor 1 em que os elementos de P sejam diferentes
ou em que os elementos sejam todos 1. A variância pode ser 1 e, consequentemente, a
raiz de 1 ser 1 e representar o desvio padrão.
σ² = 1.
σ² = √1 = 1
O valor 1 da variância pode ser conseguido com elementos iguais ou diferentes.
e. O desvio padrão não altera, apenas a média aritmética. A média aritmética subtrai o K.