Técnica de Amostragem Flashcards
TIPOS DE AMOSTRAGEM
Pode-se definir o processo de seleção de amostra em dois grandes grupos: Amostragem
probabilística e Amostragem não probabilística.
- Amostragem probabilística:
A amostragem é probabilística quando a seleção da amostra é feita de forma aleatória,
sendo que cada elemento da população tem uma probabilidade conhecida de participar da amostra. Assim: se N define o tamanho da população e se todos os elementos da população
possuem igual probabilidade, teremos que 1/ N é a probabilidade de cada elemento participar
da amostra.
AP (n) = 1/N
N = {1, 2, 3, 4, 5}
AP (n) = 1/5 . 100 = 20%
N = {A, B, C, D, E}
Cada pessoa tem 20% de probabilidade de participar da amostra.
- Amostragem não probabilística:
A amostragem é não probabilística quando há uma escolha deliberada dos elementos
da amostra. Este tipo de amostragem pode prejudicar a representatividade da amostra em
relação à população.
Quando se fala em amostragem, ela precisa ser representativa. Assim, com uma probabilidade não probabilística, pode haver um problema na hora de representar a população.
Situações de uma Amostragem não Probabilística
- Inacessibilidade a toda a população.
- Amostragem a esmo ou sem norma. “algo que feito sem uma forma definida”.
- A população é formada por material contínuo. Exemplo: estudos com rochedos, líquidos, magma. É impossível ter acesso a todo o material, usando apenas o que está na superfície, que nem sempre representa toda a população.
- Amostragens intencionais. Exemplo: estudo em que são escolhidos indivíduos específicos, de maior relevância. Essa amostra não representa a população como um todo.
TÉCNICAS DE AMOSTRAGEM PROBABILÍSTICA
- Amostragem aleatória simples
- Amostragem sistemática
- Amostragem por meio de conglomerados
- Amostragem estratificada: uniforme, proporcional e ótima.
- Amostragem aleatória simples
Esse tipo de amostragem, também chamada simples ao acaso. Os elementos da população são enumerados, em que a seleção da amostra é feita por meio de um sorteio, sem
restrição, em que CADA ELEMENTO DA POPULAÇÃO TEM A MESMA PROBABILIDADE de pertencer à amostra. A população é numerada de 1 a N. Escolhem-se, em seguida, na Tabela de números aleatórios (TNA), n números compreendidos entre 1 e N. Os elementos correspondentes aos números escolhidos formarão a amostra.
Tabela de Números Aleatórios (T.N.A.)
Exemplo: Para observar a estatura de 90 alunos, devemos compor uma amostra de, no
mínimo, 9 indivíduos.
N = 90
n = 9
- Amostragem sistemática
Quando os elementos da população se apresentam ordenados e a retirada dos elementos da amostra é feita periodicamente, temos uma amostragem sistemática. Assim, por exemplo, em uma linha de produção, podemos, a cada dez itens produzidos, retirar um para pertencer a uma amostra da produção diária.
Considere o exemplo:
N = 800, n = 50 e a população já ordenada, poderemos adotar o seguinte procedimento:
K = N/n
K = 800/50
K = 16
Sortear um número de 1 a 16 (note-se que 800/50 = 16), o qual indicaria o primeiro elemento sorteado para a amostra; os demais elementos seriam periodicamente retirados de
16 em 16. Equivalentemente, poder-se-iam considerar os números de 1 a 800 dispostos
sequencialmente em uma matriz com 50 linhas e 16 colunas, sorteando-se a seguir uma
coluna, cujos números indicariam os elementos da amostra.
Vemos que, nesse caso, cada elemento da população ainda teria probabilidade 50/800(n/N)
de pertencer à amostra, porém existem agora apenas 16 possíveis amostras:
P(n)= 50/800 = 1/16
A principal vantagem da amostragem sistemática está na grande facilidade na determinação dos elementos da amostra. O perigo em adotá-la está na possibilidade da existência de
ciclos de variação da variável de interesse, especialmente se o período desses ciclos coincidir com o período de retirada dos elementos da amostra.
Exemplo: escolheu-se um período. Como é um ciclo, algo periódico acontece, como uma
equipe x que trabalha. Logo, o período coincide com essa equipe. Caso queira-se retirar de
uma empresa uma amostra de funcionário, a amostra será viciada, já que sempre serão as
mesmas pessoas, não sendo representativa da população.
Por outro lado, se a ordem dos elementos na população não tiver qualquer relacionamento com a variável de interesse, então a amostragem sistemática terá efeitos equivalentes
à causal simples, podendo ser utilizada sem restrições.
Vejamos um exemplo:
Julgue o item abaixo, a respeito de técnicas de amostragem.
Em uma amostragem sistemática cuja fração de seleção seja igual a 3 e o tamanho da
amostra seja igual a 125.000 observações, o tamanho da população será superior a 300.000
elementos.
K = N/n
3 = N/125.000
N = 3x125.000
N = 375.000.
- Amostragem por meio de conglomerados
Quando a população apresenta uma subdivisão em pequenos grupos, chamados conglomerados, é possível - e muitas vezes conveniente - fazer-se a amostragem por meio desses conglomerados, a qual consiste em sortear um número suficiente de conglomerados, cujos elementos constituirão a amostra. Ou seja, as unidades de amostragem, sobre as quais é feito o sorteio, passam a ser os conglomerados e não mais os elementos individuais da população. Esse tipo de amostragem é às vezes adotado por motivos de ordem prática e econômica.
ATENÇÃO!!!
Nos tipos de amostragem anteriores, quando se fala em unidade amostral, é quem ou o
que se está pegando para constituir o estudo. Na amostragem por meio de conglomerados,
pega-se o grupo como amostragem.
Exemplo: com a Covid, muitas tribos e populações podem estar sofrendo com a doença.
Quer-se fazer uma estatística do que está acontecendo, de maneira prática. Se for analisar
cada indivíduo dentro de uma tribo, não será prático. Por isso, ao invés de ir-se a todas as
tribos, vai-se as que estão mais perto, o que será mais econômico e prático. Por meio dos conglomerados, faz-se as estimativas, aplica-se a estatística inferencial e toma-se as decisões.
- Amostragem estratificada
Muitas vezes a população se divide em subpopulações ou estratos, sendo razoável supor que, de estrato para estrato, a variável de interesse apresente um comportamento substancialmente diverso, tendo, entretanto, comportamento razoavelmente homogêneo dentro de cada estrato.
Exemplo: estudo sobre o nível de violência em servidores: grupo de militares que trabalha
diretamente com a segurança pública; grupo de servidores do Ministério Público que trabalha com a segurança pública; grupo de policiais civis; grupo de juízes; grupos de assistentes
sociais. Dentro de cada estrato, pode haver situações e pensamentos diferentes, de acordo
com o trabalho de cada um, mas, dentro do estrato, são homogêneos.
Em tais casos, se o sorteio dos elementos da amostra for realizado sem se levar em
consideração a existência dos estratos, pode acontecer que os diversos estratos não sejam
convenientemente representados na amostra, a qual seria mais influenciada pelas características da variável nos estratos mais favorecidos pelo sorteio.
Exemplo: aplicar uma amostragem aleatória simples, sem considerar os estratos, ia-se
numerar os servidores, pagar uma TNA simples e escolher os participantes do estudo. Pode
acontecer de a amostrar ter mais policiais e promotores, não haver ninguém da assistência
social ou juízes. Essa amostra teria uma fragilidade, porque não terá a visão de todos os
estratos.
Evidentemente, a tendência da ocorrência de tal fato será tanto maior quanto menor o
tamanho da amostra. Para evitar isso, pode-se adotar uma amostragem estratificada.
A amostragem estratificada consiste em especificar quantos elementos da amostra serão
retirados em cada estrato. Ou seja, é preciso definir quantos indivíduos serão pegos dentro
de cada estrato. Depois disso, aplica-se a amostragem aleatória simples dentro de cada um.
É costume considerar três tipos de amostragem estratificada: uniforme, proporcional
e ótima.
- Amostragem estratificada: proporcional.
Na proporcional, o número de elementos sorteados em cada estrato é proporcional ao
número de elementos existentes no estrato. Evidentemente, a amostragem estratificada uniforme será, em geral, recomendável se os estratos da população forem pelo menos aproximadamente do mesmo tamanho; caso contrário, será em geral preferível a estratificação proporcional, por fornecer uma amostra mais representativa da população.
- Amostragem estratificada: ótima.
A amostragem estratificada ótima, por sua vez, toma, em cada estrato, um número de
elementos proporcional ao número de elementos do estrato e também à variação da variável de interesse no estrato, medida pelo seu desvio padrão. Pretende-se assim otimizar a obtenção de informações sobre a população, com base no princípio de que, onde a variação
é menor, menos elementos são necessários para bem caracterizar o comportamento da variável. Dessa forma, com um menor número total de elementos na amostra, conseguir-se-ia
uma quantidade de informação equivalente à obtida nos demais casos.
Na amostra estratificada ótima, além de se ver o tamanho, é preciso pegar os elementos
da amostra e calcular o desvio padrão. Caso ele seja pequeno, é porque os elementos são
parecidos e não será necessário pegar muitos elementos. Porém, caso os elementos sejam
muito diferentes, é preciso pegar mais.
As principais dificuldades para a utilização desse tipo de amostragem residem nas complicações teóricas relacionadas com a análise dos dados e em que, muitas vezes, não podemos avaliar de antemão o desvio padrão da variável nos diversos estratos. Constituem exemplos em que uma amostragem estratificada parece ser recomendável a estratificação de uma
cidade em bairros, quando se deseja investigar alguma variável relacionada à renda familiar;
a estratificação de uma população humana em homens e mulheres, ou por faixas etárias; a
estratificação de uma população de estudantes conforme suas especializações etc.
Essa técnica é boa, porém, em algumas situações, não é possível encontrar o desvio
padrão, já que ele é desconhecido. Por isso, ela é menos usada. As técnicas mais usadas
são a uniforme e, principalmente a proporcional.
- Amostragem estratificada: uniforme.
Na amostragem estratificada uniforme, sorteia-se igual número de elementos em
cada estrato.
Exemplo: mesma quantidade de policiais civis, membros do Ministério Público, juízes,
assistentes sociais. Esses estratos têm o mesmo tamanho e a quantidade de elementos
também será.
(CESPE/2020/TJ-PA/ANALISTA JUDICIÁRIO/ESTATÍSTICA) Uma população de 1.200
elementos possui um sistema de referências ordenado de 1 a 1.200. Com o propósito
de se obter uma amostra de 300 elementos dessa população, dividiram-na em 300 grupos de 4 unidades populacionais, tendo sido a unidade 2 selecionada aleatoriamente
entre as 4 primeiras unidades. Em seguida, foram selecionadas as segundas unidades dos 299 grupos restantes, completando-se, assim, a amostra de 300 unidades
populacionais.
Nesse caso, foi utilizada a amostragem:
a. por conglomerados em um estágio.
b. estratificada.
c. sistemática.
d. aleatória simples.
e. por intervalos.
c. sistemática.
- A constante é k = 4.
- ‘’2’’ é a unidade selecionada.
- Dentro de cada grupo:
– Seleciona-se o número ‘’2’’.
(CESPE/2020/TJ-PA/ANALISTA JUDICIÁRIO/ESTATÍSTICA) O dono de um restaurante pretende selecionar 50 de seus clientes fidelizados para a degustação de uma nova receita que deseja incluir no cardápio. Ele possui um cadastro em que cada cliente
fidelizado está numerado sequencialmente de 1 a 1.980. Para realizar a seleção, ele decidiu utilizar a técnica de amostragem sistemática.
Nessa situação, caso o intervalo de seleção da amostra seja igual a 39 e a primeira
unidade populacional selecionada seja a 12º, então a terceira unidade populacional
selecionada será a:
a. 117º.
b. 36º.
c. 90º.
d. 51º.
e. 3º.
LETRA C
- N = 1980 (população);
- n = 50 (clientes);
- k = 39 (intervalo).
- x = 12º cliente.
- Posição = ?
(CESPE/2020/TJ-PA/ANALISTA JUDICIÁRIO/ESTATÍSTICA) Um professor de educação física realizou uma pesquisa a respeito das alturas dos estudantes da instituição
de ensino onde trabalha. A instituição possui 1.285 estudantes, dos quais 535 são homens e 750 são mulheres. Para realizar essa pesquisa, foi selecionada uma amostra de 257 estudantes pelo método de amostragem estratificada com alocação proporcional, considerando-se os estratos homem e mulher.
Nessa situação, foram selecionados:
a. 107 homens e 150 mulheres.
b. 128 homens e 129 mulheres.
c. 110 homens e 147 mulheres.
d. 150 homens e 107 mulheres.
e. 129 homens e 128 mulheres.
LETRA A.
A amostra representa 20% do total.
Amostra = 257, proporção 257/1285 = 20%
Homem = 535 x 20% = 107
Mulher = 750 x 20% = 150
(CESPE/2020/TJ-PA/ANALISTA JUDICIÁRIO/ESTATÍSTICA) Uma população é dividida nos estratos I, II e III. O estrato I é composto por 400 elementos; o II, por 600 elementos; e o III, por 1.000 elementos. Conforme um estudo piloto, os desvios padrão da
variável de interesse nos estratos I, II e III são, respectivamente, 10, 20 e 8.
Caso um pesquisador pretenda retirar uma amostra aleatória de 240 elementos dessa
população utilizando a locação ótima de Neyman, os tamanhos das amostras a serem
extraídas dos estratos I, II e III devem ser, respectivamente:
a. 40, 30 e 170.
b. 40, 120 e 80.
c. 48, 72 e 120.
d. 79, 81 e 80.
e. 50, 75 e 115.
b. 40, 120 e 80.
(CESPE/2020/TJ-PA/ANALISTA JUDICIÁRIO/ESTATÍSTICA) Muitos sorteios virtuais
são realizados em uma plataforma que gera números de maneira aleatória, sendo cada
número sorteado apenas uma vez com a mesma probabilidade. Essa técnica é denominada amostragem:
a. estratificada.
b. aleatória simples com repetição.
c. sistemática.
d. aleatória simples sem repetição.
e. por conglomerados.
d. aleatória simples sem repetição.
(CESPE/2020/TJ-PA/ANALISTA JUDICIÁRIO/ESTATÍSTICA) Uma pesquisa foi realizada em uma população dividida em dois estratos, A e B. Uma amostra da população foi
selecionada utilizando-se a técnica de amostragem estratificada proporcional, em que
cada estrato possui um sistema de referências ordenadas. A seguir, são apresentadas as formas como as unidades populacionais de A e de B foram selecionadas, respectivamente.
* A primeira unidade populacional selecionada do estrato A foi a terceira. Em seguida,
cada unidade populacional foi selecionada a partir da primeira, adicionando-se 5 unidades. Dessa forma, a segunda unidade selecionada foi a oitava, e assim por diante,
até a obtenção de 10 unidades populacionais.
* A primeira unidade populacional selecionada do estrato B foi a quarta. Após, cada
unidade populacional foi selecionada a partir da primeira, adicionando-se 6 unidades.
Dessa forma, a segunda unidade selecionada foi a décima, e assim por diante, até a
obtenção de 7 unidades populacionais.
A partir dessas informações, é correto afirmar que:
a. a população possui, no mínimo, 88 elementos.
b. a técnica de amostragem aleatória simples foi utilizada para selecionar a amostra de
cada estrato.
c. a amostra possui, no mínimo, 92 unidades populacionais.
d. o estrato B possui mais unidades populacionais que o estrato A.
e. o intervalo de amostragem no estrato A possui amplitude maior que o intervalo de
amostragem no estrato B.
a. a população possui, no mínimo, 88 elementos.
Estrato A:
3 8 13 18 23 28 33 38 43 48
Estrato B:
4 10 16 22 28 34 40
População mínima = 48 +40 = 88
TEXTO
Considerando que R representa uma variável quantitativa cuja média, mediana e variância são, respectivamente, iguais a 70, 80 e 100, e que 𝑈 = 𝑅 /10 − 7, julgue os próximos itens,
acerca das variáveis 𝑈 e 𝑅.
(CESPE/2020/MINISTÉRIO DA ECONOMIA/ESPECIALISTA EM CIÊNCIAS DE
DADOS) O desvio padrão da variável 𝑈 é igual a 1.
CERTO.
- R = 70 (média)
- MR = 80.
- S²R = 100
SR = 10 (desvio padrão).
Obs.: o desvio padrão não sofre alteração com soma ou subtração.
U = 0,1 R – 7
(CESPE/2020/MINISTÉRIO DA ECONOMIA/ESPECIALISTA EM CIÊNCIAS DE
DADOS) A correlação linear entre as variáveis 𝑈 e 𝑅 é igual a zero.
ERRADO.
- Trata-Se de uma função de primeiro grau, que gera uma linha (reta).
- Assim, deve-se fazer um gráfico e buscar se existe uma reta.
- Fórmula: U =???
(CESPE/2020/MINISTÉRIO DA ECONOMIA/ESPECIALISTA EM CIÊNCIAS DE
DADOS) A mediana de 𝑈 é negativa.
ERRADO.
- R = 70 (média)
- MR = 80.
- S²R = 100
- Basta substituir o MR pelos eu valor e calcular a mediana de U.
U = R/10 - 7
MU = MR/10 - 7
MU = 80/10 - 7 = 8-7 = 1
(CESPE/2020/MINISTÉRIO DA ECONOMIA/ESPECIALISTA EM CIÊNCIAS DE
DADOS) A variável 𝑈 possui média nula.
CERTO.
Obs.: Fórmula:
Para se achar a média de U, deve-se usar a média de R.
* R = 70 (média)
* Após a subtração, terá o valor da média de U.
U = R/10 - 7
U = R/10 - 7
U = 70/10 - 7
U = 7 - 7
U = 0
(CESPE/2020/MINISTÉRIO DA ECONOMIA/ESPECIALISTA EM CIÊNCIAS DE
DADOS) O coeficiente de variação de 𝑅 é superior a 15%.
ERRADO.
- Coeficiente de variação:
CV = S/X - S²R = 100
- SR = 10
- R = 70 (média).
25m
Cv = 10/70 ≅ 14,2%
(CESPE/TCE-RO/AUDITOR DE CONTROLE EXTERNO/ENGENHARIA CIVIL/2019)
Nos processos de controle, o objetivo fundamental da amostragem estatística consiste em
a. identificar os fatores que podem influenciar variáveis específicas de um processo em
desenvolvimento.
b. calcular, por meio de iterações, estimativas de custos ou cronogramas, usando valores
de entrada aleatórios.
c. estimar como uma mudança na variável independente influenciará o valor da variável
dependente.
d. garantir que um subgrupo selecionado represente, de forma adequada, a população
de interesse.
e. aferir resultados médios com bases em possíveis cenários futuros, que podem
ocorrer ou não.
LETRA D.
Independente, de qual técnica está sendo utilizada, quando se constrói a sua própria
amostra, ela deve conter o seu objetivo fundamental.
A amostra é um subconjunto de uma população e que demonstra a representatividade desta. Portanto, independente da técnica, deve-se garantir que a amostragem tenha um
subgrupo que represente, de forma adequada, a população.