Aula 5 - Estatística descritiva Flashcards
Introdução
A população é o nome que se dá ao grande conjunto de dados que contém todos os
elementos de interesse.
Analisando as dificuldades enfrentadas para pesquisar uma população com todos os
seus elementos, tomam-se alguns deles para formar um grupo a ser estudado. Esse grupo ou
subconjunto da população chama-se amostra.
Em uma pesquisa, cada um dos aspectos investigados, os quais nos darão condições de
fazer uma análise desejada, é chamados de variável.
Deve-se levar em conta dois tipos de
variáveis: as numéricas e as não-numéricas. As variáveis numéricas serão chamadas de
quantitativas e as não-numéricas serão chamadas de qualitativas.
Dentre essas técnicas está o cálculo das medidas de tendência central (média, mediana
e moda), que reduz o conjunto de dados para um único valor e as medidas de dispersão
(variância, desvio padrão e coeficiente de variação) que analisa a heterogeneidade ou
homogeneidade do conjunto dos dados, em relação à média, ou seja, em quanto se afasta
da média cada variável do conjunto de dados.
1 Estatística – conceitos e definições importantes
A estatística descritiva é um conjunto de técnicas com o objetivo de simplificar os
dados de uma pesquisa, para que seja feita uma análise dos dados obtidos.
Uma das maneiras para representação da simplificação dos dados é a tabela
de frequência. Para cada
variável, vamos construir uma nova tabela com as informações resumidas.
Na tabela de frequência, para cada variável observada, conta-se o número de
realizações dessa variável e colocamos na coluna de frequência absoluta (ni). A razão entre a
frequência absoluta e o total das realizações, é a coluna da frequência relativa (fi). A coluna
da porcentagem (%) é o produto da frequência relativa por 100.
Quantitativa discreta: (suas realizações são números inteiros); Quantitativa contínua: suas realizações serão apresentadas por meio de classes ou intervalos.
1.2 Medidas de tendência central e medidas de dispersão
A média (𝑥̅)é a soma das observações dividido pelo número delas.
A mediana (Md) é a realização, o que ocupa a posição central do conjunto de dados, quando dispostos em ordem crescente. A mediana divide o conjunto pela metade, deixando 50% abaixo dele e 50% acima dele.
A moda (Mo) é a realização de maior frequência no conjunto de dados.
Essas medidas não são suficientes pois não mostram
toda a variabilidade do conjunto de observações.
As medidas de dispersão nos
permitem verificar a variabilidade de suas realizações e compará-las com a média. É possível
analisar o quão distantes as variáveis estão, ou não, da média.
A variância (𝝈𝟐) é o quadrado da média da diferença entre as variáveis e o desvio
padrão (𝝈) é a raiz quadrada da variância.
O coeficiente de variação é o quociente entre o desvio padrão e a média, multiplicado
por 100, para que a resposta seja em porcentagem. Esse coeficiente indica a porcentagem que as variáveis estão afastadas da média.