1.2 Apresentação das Variáveis Estatísticas Flashcards
Em Matéria de Estatística, quanto à Apresentação das Variáveis Estatísticas,
Como construir uma tabela com dados em classes?
Dizendo de forma mais específica, dado um conjunto de dados, qual a melhor forma de estipular o nº de classes em que tais dados devam ser divididos e também qual o espaçamento entre as classes?
Suponha uma amostra de 36 elementos com amplitude total de 12.
Para determinar a quantidade ideal de classes, basta dividir o nº de elementos da amostra por √N. Logo,
nº classes = 36 / √36
nº classes = 36 / 6
nº classes = 6
Com a amplitude total, divide-se ela pelo nº de classes. Uma amplitude total de 12 dividida em 6 classes resulta em classes que variam 2 unidades por intervalo.
Portanto, as classes ficarão assim:
1) 2-4
2) 4-6
3) 6-8
4) 8-10
5) 10-12
6) 12-14
Em Matéria de Estatística, quanto à Apresentação das Variáveis Estatísticas,
Qual é a utilidade do conceito de densidade de frequência?
É que, algumas vezes, uma classe contém um número maior de elementos porque contém uma amplitude maior que outras classes.
Pense por exemplo na classe 10-20 que contém 20% dos elementos da população; e uma outra classe 20-40 que contém 15% dos elementos da população.
Ora, como a classe 20-40 é mais ampla (vai de 20 até 40), é natural que ela abarque mais elementos. No entanto, mesmo assim ela obteve uma frequência de apenas 15% do total de elementos. Logo, mesmo a 10-20 sendo menos ampla, ela obteve uma frequência maior.
O conceito de densidade de frequência é importante por isto, pois ele equaliza a amplitude das classes de forma que tal comparação seja mais “justa”.
DensidadedeFrequência = LarguradaClasse / FrequênciadaClasse
Em Matéria de Estatística, quanto à Apresentação das Variáveis Estatísticas,
O histograma é adequado para qual tipo de tabela ou dados?
Quando os dados são distribuídos em classes porque a variável é contínua. Ou seja, quando se trata de faixas salariais o histograma é bom, pois uma mesma classe irá abarcar vários valores.
Já no gráfico de barras, isto não seria possível, pois cada valor de salário teria, muito provavelmente, uma única frequência de ocorrência, dada a grande variabilidade de uma variável contínua.
Logo, o histograma faz mais sentido para variáveis contínuas, categorizadas por classes, enquanto que o gráfico de barras faz mais sentido para variáveis discretas, como a segmentação do número de funcionários por departamentos, dado que cada departamento poderia ser representado por uma barra - o que seria uma variável discreta (inteira).
Em Matéria de Estatística, quanto à Apresentação das Variáveis Estatísticas,
Qual gráfico deve ser utilizado quando a variável estudada puder assumir diversos valores em função da variável independente?
O gráfico de dispersão
Pois para um mesmo valor de uma variável, a outra pode ter vários valores.
Exemplo: idade e salário. Pessoas com a mesma idade podem ter diferentes salários e pessoas com o mesmo salário podem ter diferentes idades. Logo, o gráfico de dispersão é o que melhor representa os diversos valores que podem ser assumidos em função de uma variável independente.
Em Matéria de Estatística, quanto à Apresentação das Variáveis Estatísticas,
Como se realiza aquela operação de “Interpolação Linear”?
Para isto, suponha uma classe com os valores abaixo e suas respectivas frequências, totalizando 150 frequências.
1.000 - 2.000 → frequência 10
2.000 - 3.000 → frequência 20
3.000 - 4.000 → frequência 30
4.000 - 5.000 → frequência 40
5.000 - 6.000 → frequência 50
É para quando você quer achar um valor que está no meio de uma classe. Ela é feita por uma proporção entre segmentos de reta.
Utilizando os dados ao lado, podemos, por exemplo, obter a mediana destes valores - poderíamos também obter o 1º quartil, 3º quartil, ou outros valores. O raciocínio será sempre o mesmo.
Para se obter a Mediana, o primeiro passo é identificar a classe da Mediana, que será a classe que contém o nº 75,5, que estará na classe 4.000 - 5.000.
Logo, podemos fazer uma proporção, onde teremos em um extremo o valor de 4.000 na posição 60, o valor da Mediana na posição 75,5 e, por fim, o valor 5.000 na posição 100.
Para isto, constrói-se a seguinte fórmula
(Mediana - 4.000) / (75,5 - 60) = (5.000 - 4.000) / (100 - 60)
Mediana - 4.000) / 15,5 = 1.000 / 40
Mediana - 4.000 = 25 * 15,5
Mediana = 387,50 + 4.000
Mediana = 4.387,50
Obs: note que, para esta construção, você inclui o valor da frequência acumulada da última classe - ou seja, foi incluído o 60 e não o 61 - assim como se inclui o último valor da respectiva classe - incluiu-se o 100, e não o 101.
Em Matéria de Estatística, quanto à Apresentação das Variáveis Estatísticas,
Em um gráfico de BoxPlot, como interpretar os valores? Infelizmente não dá para replicar uma imagem aqui.
Um gráfico de Boxplot normalmente tem
1) Uma pequena linha horizontal no topo do gráfico, que representa o maior valor da amostra (isto se não tiver nenhum outlier).
2) A linha superior do retângulo representa o 3º quartil. Logo, 75% dos elementos estarão abaixo e 25% acima.
3) No mesmo retângulo, uma linha horizontal dentro dele, que representa o 2º Quartil e a Mediana (são o mesmo valor).
4) A linha horizontal inferior do retângulo representa o 1º quartil. Portanto, 75% dos valores estão acima e 25% abaixo.
5) A pequena linha horizontal na parte mais baixa do gráfico representa o menor valor obtido (isto se não tiver um outlier também).
Obs: é possível afirmar que 50% dos valores estarão dentro do retângulo. E que do retângulo até as linhas horizontais temos os 25% restantes (para cima e para baixo), descontados os respectivos ooutliers)
Em Matéria de Estatística, quanto à Apresentação das Variáveis Estatísticas,
Como se calcula os Outliers de um Boxplot?
Os Outliers serão os valores que estarão acima do Limite Superior e abaixo do Limite Inferior.
Li = Q1 – 1,5 · (Q3 – Q1)
Ls = Q3 + 1,5 · (Q3 – Q1)
Lembrando que
- Q1 = parte inferior do retângulo Boxplot
- Q3 = parte superior do retângulo Boxplot
Em Matéria de Estatística, quanto à Apresentação das Variáveis Estatísticas,
Se me é fornecido um histograma com um gráfico de densidade de frequência, como obter a frequência de cada classe?
A frequência de cada classe será a Densidade de Frequência (gráfico) vezes a amplitude da respectiva classe.
Exemplo: se a densidade da frequência é 0,025% e a classe vai de 2.000 a 4.000, temos que a frequência será 0,025% · 2.000 = 50%
Logo, esta classe que vai de 2.000 a 4.000 e tem densidade de frequência de 0,025% representará 50% da frequência da amostra.
Em Matéria de Estatística, quanto à Apresentação das Variáveis Estatísticas,
O gráfico “Scatter Plot” é um outro nome para qual tipo de gráfico?
Para o gráfico de DISPERSÃO
Em Matéria de Estatística, quanto à Apresentação das Variáveis Estatísticas,
Digamos que eu tenha 80 dados agrupados em classe e quero calcular a mediana pelo método de interpolação linear, devo considerar a mediana como ocupada por qual posição?
POSIÇÃO 40 E NÃO POSIÇÃO “40,5”
NO MÉTODO DE INTERPOLAÇÃO LINEAR, BASTA PEGAR A MEDIANA COMO A METADE DO CONJUNTO, E NÃO AQUELE AJUSTE DE QUE DIVIDE METADE PARA UM LADO E METADE PARA O OUTRO!
Em Matéria de Estatística, quanto à Apresentação das Variáveis Estatísticas,
A linha ao meio do gráfico do Box Splot traz a ____ (média / mediana)
Além disso, o desvio quartílico é calculado por ____ ?
Mediana!
Desvio Quartílico = (Q3 - Q1) / 2