Probabilidade Flashcards
Princípio do Teorema Central do Limite
AS MÉDIAS DE AMOSTRAS GRANDES E ALEATÓRIAS SÃO APROXIMADAMENTE NORMAIS.
O teorema central do limite é um teorema fundamental de probabilidade e estatística.
O teorema descreve a distribuição da média de uma amostra aleatória de uma população
com variância finita. Quando o tamanho amostral é suficientemente grande, a distribuição da média é uma distribuição aproximadamente normal.
O teorema aplica-se independentemente da forma da distribuição da população. Muitos
procedimentos estatísticos comuns requerem que os dados sejam aproximadamente
normais. O teorema central do limite permite a aplicação destes procedimentos úteis a populações que são fortemente não normais.
A maioria das distribuições não são normais, todavia é necessário tentar aproximá-las do
normal. Por esse teorema, quanto maior for a amostra, a tendência é que ela se torne normal.
ATENÇÃO!!!
Esse teorema é o responsável por dar vida à distribuição normal.
Aumentando a distribuição de elementos, se chegará a uma distribuição normal.
(COSEAC/ANCINE/ESPECIALISTA EM REGULAÇÃO) O princípio do Teorema Central do Limite, aplicado a testes estatísticos, descreve que;
a. a distribuição amostral das médias, aplicada a toda e qualquer população, tenderá à
distribuição normal, desde que o tamanho da amostra seja suficientemente grande;
b. quanto mais o tamanho da amostra aumenta, mais a forma da distribuição amostral
da média distancia-se da forma da normal;
c. o resultado da pesquisa aplicada a qualquer população reproduz melhor a realidade
quando as variáveis são previstas;
d. se a relação entre variáveis é muito grande na amostra pesquisada, o valor encontrado pode ser o mesmo que em um estudo baseado em uma pequena amostra;
e. o tamanho da amostra aumenta e a forma da distribuição amostral desaparece.
LETRA A.
O teorema trata sobre inserir elementos e calcular as médias, tendendo à distribuição normal.
(COSEAC/DATA PREV/ANALISTA DE TECNOLOGIA DA INFORMAÇÃO-ANÁLISE DE INFORMAÇÕES) O Teorema central do limite aplica-se a qualquer população com_________ finito(a), _________ da forma da distribuição original. Entretanto, quanto
mais a população original se _________ da distribuição normal, _________ é o tamanho da amostra necessário para assegurar a normalidade da distribuição amostral.
Os termos que completam adequadamente o trecho acima são, respectivamente:
a. desvio-padrão / independente / afasta /maior;
b. média / dependente / afasta /maior;
c. desvio-padrão / dependente / aproxima /menor;
d. variância / dependente / afasta /maior;
e. média / independente / aproxima /menor.
a. desvio-padrão / independente / afasta /maior;
Análise da Curva
Essa curva sempre irá trabalhar com dois parâmetros:
* Média
* Desvios-padrão
Na notação, esses parâmetros aparecem. Em uma população com distribuição não
normal, aumenta-se os elementos, transforma-se em normal e, com os dois parâmetros, vai
ser possível analisar a curva:
As variáveis são simétricas. O foco do estudo é a área que está abaixo da curva, isto é,
a probabilidade.
0 ≥ p (n) ≤ 1
A área, ou probabilidade de baixo da curva, limitada por mais um desvio-padrão e menos
um desvio-padrão, corresponde a 68%. Para menos dois e mais dois desvios-padrão, aproximadamente, 95%. Para menos e mais 3 desvios–padrão, 99,7%.
Exemplo: Considere uma população de uma cidade A e uma outra cidade B. Suponhamos
que todas as pessoas tenham informado as respectivas alturas (em centímetros). E deseja-se
fazer uma comparação entre tais populações. Considere a tabela:
Um pesquisador deseja sortear aleatoriamente pessoas para fazer um certo estudo em
relação ao crescimento e para isso gostaria de pessoas com mais de 1,80 m.
Em qual das populações será mais fácil encontrar pessoas com tais características?
Qual das duas populações possui maior probabilidade de escolher alguém entre
1,75 e 1,80?
ATENÇÃO!!!
Não cabe comparar o tamanho das curvas.
Na população B, é possível perceber que mais de 50% da população tem entre de 1,75
a 1,80 m e menos de 50% da população A tem entre de 1,75 a 1,80 m.
Desse modo, a população B possui maior probabilidade.
DISTRIBUIÇÃO NORMAL PADRÃO
- É uma distribuição normal com média igual a 0 e desvio padrão igual a 1;
- Geralmente a variável aleatória associada à distribuição normal padrão é a letra Z;
- Notação: Z ~ N(0,1), ou seja, µZ = 0 e σZ = 1;
- Toda variável X ~N (µ, σ2) deve ser transformada em Z ~ N(0,1), para que se possam
realizar os cálculos de probabilidade.
Na prática, deseja-se calcular probabilidades para diferentes valores da média µ e
desvio padrão σ.
Para isso, a variável X, cuja distribuição é N (µ, σ), é transformada em uma forma
padronizada Z com distribuição N(0,1) (distribuição normal padrão), pois tal distribuição
é tabelada.
A quantidade Z é dada por:
(CESPE) O valor diário (em R$ mil) apreendido de contrabando em determinada região do país é uma variável aleatória W que segue distribuição normal com média igual a R$ 10 mil e desvio padrão igual a R$ 4 mil. Nessa situação hipotética,
A razão segue distribuição normal padrão.
(FADESP/2020/UEPA/TÉCNICO DE NÍVEL SUPERIOR/ESTATÍSTICA) A variável aleatória X tem distribuição normal com média µ = 2 e variância σ2= 9. Seja Y uma variável aleatória definida por Y = 2X + 1. Nestas condições, pode-se afirmar que Y tem distribuição:
a. normal com média µ = 2 e variância σ2= 30.
b. qui-quadrado com µ =5 e variância σ2= 36.
c. normal com média µ = 5 e variância σ2= 9.
d. normal com média µ = 5 e variância σ2= 36.
d. normal com média µ = 5 e variância σ2= 36.
A variável X depende da variável Y.
X ~N (2,9)
Y ~N (…,…)
Y= 2x+1
µY = 2. µx + 1
µY = 2. 2 + 1 = 5
Variância: y = 2x + 1
S²Y= 2. S²x + 1
S²Y= 2. 9 + 1
(a variância não se altera com a soma ou subtração de uma constante, dessa forma desconsidera-se o 1)
S²Y= (2)². 9
(Em caso da multiplicação com uma constante, a variância relaciona-se com o quadrado da constante, nesse caso 2²)
S²Y= 4. 9
S²Y= 36
Com isso, Y ~N (5, 36)
(NC-UFPR/PREFEITURA DE CURITIBA/AUDITOR FISCAL DE TRIBUTOS MUNICIPAIS/2019) Para uma determinada profissão, sabe-se que o salário é uma variável aleatória que possui distribuição Normal com média R$ 5.000,00 e um desvio padrão de R$ 800,00. Nesse caso, qual é a probabilidade de que um salário seja maior que
R$ 7400,00?
a. menor que 0,01.
b. 0,16.
c. 0,48.
d. 0,58.
e. maior que 0,99.
LETRA A.
EXEMPLOS PRÁTICOS
Exemplo 1: Analistas da linha de produção calcularam o tempo médio de 75 segundos e
desvio padrão de 6 segundos para a montagem de uma peça. Qual a probabilidade de um
trabalhador levar um tempo menor ou igual a 81 segundos?
Resposta:
P (Z ≤ 1) = 84,13%.
(2020/CESPE/CEBRASPE/MINISTÉRIO DA ECONOMIA/TECNOLOGIA DA INFORMAÇÃO - CIÊNCIA DE DADOS): Um levantamento amostral proporcionou as estatísticas precedentes, referentes a determinada variável quantitativa X. Considerando essas informações e que a variável X é composta por 1240 observações, julgue o item subsequente.
O desvio padrão de X foi inferior a 6.
CERTO.
N = 1240
Moda/mediana/média: são medidas de centralidade.
Para calcular o desvio padrão, temos que calcular primeiro a variância, onde a variância
nada mais é do que média do quadrado dos desvios divididos por N ou N-1, dependendo
se for amostra ou população e seguida se extrai a raiz quadrada para encontrar o desvio padrão.
Está te obriga a saber como se relacionam esses parâmetros (moda/mediana/média).
Valor mínimo: 5
Valor médio: 10
Valor máximo: 15
5 ———10 ————15
Desvio padrão é aquilo que desvia que se afasta da média. O desvio padrão possui a mesma unidade da média aritmética. A variância por sua vez é elevada ao quadrado.
ECONOMIA/TECNOLOGIA DA INFORMAÇÃO - CIÊNCIA DE DADOS): Um levantamento amostral proporcionou as estatísticas precedentes, referentes a determinada variável quantitativa X. Considerando essas informações e que a variável X é composta por 1240 observações, julgue o item subsequente.
Se A e B são as respectivas quantidades de observações da variável X que são iguais
a 9 e 10, então é correto afirmar que B>A.
ERRADO.
Quantidade de observações nada mais é do que a frequência.
A frequência de A: é 9
A frequência de B: é 10
Obs.: frequência se refere a moda, pois “moda” é aquilo que possui maior frequência.
Neste exemplo quem possui a maior frequência é o 9, posto que ele é a moda.
(2020/CESPE/CEBRASPE/MINISTÉRIO DA ECONOMIA/TECNOLOGIA DA INFORMAÇÃO - CIÊNCIA DE DADOS): Um levantamento amostral proporcionou as estatísticas precedentes, referentes a determinada variável quantitativa X. Considerando essas informações e que a variável X é composta por 1240 observações, julgue o item subsequente.
A quantidade de observações da variável X maiores ou iguais a 9 é igual ou superior a 620.
CERTO.
N = 1240
Nós temos 1240 observações.
Mediana: medida de posição. Se eu falo em mediana os valores têm que estar em rol (ordem crescente ou decrescente).
Mediana: 9
Obs.: quando se tem uma quantidade ímpar de elementos, será possível encontrar o elemento central. Todavia, diante de uma quantidade par de elementos, não será possível obter esse elemento, sendo necessário realizar a média aritmética.
(2020/CESPE/CEBRASPE/MINISTÉRIO DA ECONOMIA/TECNOLOGIA DA INFORMAÇÃO - CIÊNCIA DE DADOS): Um levantamento amostral proporcionou as estatísticas precedentes, referentes a determinada variável quantitativa X. Considerando essas informações e que a variável X é composta por 1240 observações, julgue o item subsequente.
O terceiro quartil da variável X foi inferior a 9.
ERRADO.
Mediana: 9
Se o Q2 é menor do que o Q3, não tem como o Q2 ser inferior a 9.
O Q3 é maior do que o Q2.
(2018/CESPE/POLÍCIA FEDERAL/AGENTE DE POLÍCIA FEDERAL). O valor diário (em R$ mil) apreendido de contrabando em determinada região do país é uma variável aleatória W que segue distribuição normal com média igual a R$ 10 mil e desvio padrão igual a R$ 4 mil.
Nessa situação hipotética,
P(W > R$ 10 mil) = 0,5.
CERTO.
Variável W que segue uma distribuição normal (10, 4). Os valores não foram padronizados.
Área é sinônimo de probabilidade.
Exemplo: Em uma região, o QI das pessoas adultas segue a distribuição normal com
média de 100 pontos e desvio-padrão de 15 pontos. Escolhendo uma pessoa ao acaso, qual
a probabilidade desta pessoa ter QI menor que 75 pontos?
A reta é variável X.
50% das pessoas possuem menos de 100 pontos com relação ao seu QI, enquanto 50%
das pessoas dessa mesma população possuem acima de 100 pontos com relação ao seu QI.
A média é 100 pontos. E a distribuição normal é uma distribuição simétrica, 50% das pessoas tem menos de 100 pontos com relação ao seu QI e 50% da população tem acima de
100 pontos com relação ao seu QI.
Para achar o valor de X tem que padronizar, chamar ela de Z, vai deixar de ser normal e
passar a ser normal padrão e deve-se ver quem é esse valor 75 dentro da tabela de distribuição de padrão acumulada.
P(x < 75) = P(Z < z)
Essa variável de X precisa ser padronizada. E o 75 que é realidade, é preciso verificar quem é ele na tabela. Para que enfim possa-se encontrar qual é a probabilidade.
Z = (X - μ) / σ
Z = -25/15 = -1,67
P(x < 75) = P(Z < z) = P (Z< -1,67)
P(x < 75) = P(Z < z) = P (Z<-1,67) = 0,0475 → 4,75y
Sendo assim, temos que a probabilidade de uma pessoa nessa população ter QI menor
que 75 pontos é de 4,75%.
Exemplo: A equipe interna de uma empresa audita balanços contábeis e demora em
média 40 min. e desvio-padrão de 12 min. Uma empresa de Contabilidade afirma que pode
realizar essa atividade em 25 min. em média. Qual a probabilidade dessa afirmação ser
verdadeira?
Z = (X - μ) / σ
Z = (25-40)/12
Z = - 1,25
P(X≤25) = 0,1056 = 10,56% (valor tabelado)
Sendo assim, temos que a probabilidade dessa afirmação ser verdadeira corresponde
à 10,56%.
Exemplo: Uma indústria siderúrgica produz tubos de aço cujo comprimento segue a
distribuição normal com média μ = 10,00 m e desvio padrão σ= ± 0,09 m. Se o comprimento
dos tubos ultrapassar 10,20 m eles serão refugados. Calcule a probabilidade dos tubos terem comprimentos superiores a 10,20 m.
Z = (X - μ) / σ
Z = (10,2 - 10)/0,09
Z = 2,2
P (X≤10,2) = 0,9868 = 98,68% (valor tabelado)
100% - 98,68% = 1,32%
A probabilidade dos tubos terem comprimentos superiores a 10,20 m é de 1,32%.
(UFAC/ESTATÍSTICO/2019) Suponha que a renda de cada estudante da Universidade
Federal do Acre (UFAC) seja distribuída conforme uma distribuição normal com média
igual a R$ 800,00 (oitocentos reais) e desvio padrão de R$ 300,00 (trezentos reais). Se
aleatoriamente sortearmos um(a) discente da UFAC, a probabilidade deste aluno ter
uma renda superior a R$ 1.200,00 (um mil e duzentos reais) é aproximadamente igual a:
Utilize uma das seguintes informações se necessário: Φ (1,33) = 0,9082, Φ (1,1) =
0,8643 em que Φ representa a função de distribuição acumulada da distribuição normal padrão.
a. 90,82%.
b. 9,18%.
c. 86,43%.
d. 13,57%.
LETRA B.
X ~ N (800, 300)
Média: R$ 800,00
Desvio padrão: R$ 300,00
Z ≈ N(0,1)
Para encontrar o Z, é necessário padronizar.
P(X>1200) = P(Z>…)
Z = (X - μ) / σ
Z = (1200-800)/300
Z = 1,33
P(X≤1200) = 0,9082 = 90,82% (Valor tabelado)
100% - 90,82% = 9,18%
(IADES/SES-DF/ECONOMISTA/2018) A variável normal padronizada Z é dada por, em que X é uma variável que tem distribuição normal de média µ e variância σ², conforme a figura apresentada. Considerando uma variável X que tem distribuição normal de média µ = 15,6 e variância σ² = 0,25, assinale a alternativa que indica a probabilidade p (15 < X < 16,2).
Dado: Tabela – Áreas de uma distribuição normal padrão:
a. 0,1151
b. 0,2302
c. 0,3849
d. 0,7698
e. 0,8849
μ=15,6
σ²=0,25
σ = 0,5
Neste caso, teremos que padronizar o Z1, bem como o Z2.
Z1 = (X - μ) / σ
Z1 = (15 - 15,6)/0,5
Z1 = - 0,6/0,5 = - 1,2
Z2 = (X - μ) / σ
Z2 = (16,2 - 15,6)/0,5
Z2 = 0,6/0,5 = 1,2
Percebe-se que essas áreas são aritméticas.
Na tabela fornecida, o 1,2 corresponde a 0,3849.
P(15 < X < 16,2) = P(-1,2 < Z < 1,2) = 0,3841 x 2 = 0,7698.
Esta questão não trabalhou com distribuição acumulada, mas sim com a distribuição normal.
(CESGRANRIO/2018/PETROBRAS/ESTATÍSTICO JÚNIOR) As variáveis aleatórias X e Y são independentes. A variável X segue uma distribuição Normal com média 4 e variância 16, e a Y segue uma distribuição Normal com média 9 e variância 1. A distribuição
de X - Y é Normal com:
a. média -5 e variância 15
b. média -5 e variância 17
c. média 5 e variância 15
d. média 5 e variância 17
e. média 13 e variância 15
X ~N(4,16)
Y ~N(9,1)
A questão exige a diferença entre as duas variáveis seguindo a distribuição NORMAL:
(X-Y) ~N(…, …)
ATENÇÃO!!!
E (valor esperado como se fosse a média).
E (a) = a
E (a.x) = a.E(x)
E (x+y) = E (x) + E (y) E(x-y) = E(x) – E(y)
(X-Y) ~N(…, …), queremos encontrar a média e a variância.
E (x-y) = E(x) – E(y)
E (x-y) = 4 – 9 = -5
Logo, E (x-y) = -5
E (valor esperado como se fosse a média).
E (a) = a
E (a.x) = a.E(x)
E (x+y) = E (x) + E (y) E(x-y) = E(x) – E(y)
Obs.: X e Y são independentes.
Variância: Var (a) = 0
Var (a.x) = quando há um conjunto de valores e realiza o cálculo da variância; se pegar o
conjunto de valores e multiplicá-lo por 3 (uma constante), a nova variância deve ser multiplicada pelo quadrado da constante. Com isso, temos a Variância de “x” vezes a².
Var (a.x) = a².Var (x)
{a,b} são constantes.
Var (x + b) = Var (x)
Var (x) = E (x²) – [E(x)]²
Cov (x, y) = E (x.y) – E (x). E(y)
Var (x+y) = Var (x) + Var (y) + 2.Cov (x.y)
Var (x-y) = Var (x) + Var (y) - 2.Cov (x.y)
Cov (x, a) = 0
Cov (x,x) = Var (x)
Obs.: se x e y são independentes, então a Cov (x-y) = 0 e E (x,y) = E(x).E(y)
Retomando a questão:
Var (x-y) = Var (x) + Var (y) - 2.Cov (x.y)
Var (x-y) = 16 + 1 - 2.Cov (x.y)
Se Cov (x, a) = 0:
Var (x-y) = 16 + 1 - 2.0
Var (x-y) = 17
(CESPE/2018/POLÍCIA FEDERAL/AGENTE DE POLÍCIA FEDERAL) O valor diário (em R$ mil) apreendido de contrabando em determinada região do país é uma variável aleatória W que segue distribuição normal com média igual a R$ 10 mil e desvio padrão igual a R$ 4 mil.
Nessa situação hipotética, se W1 e W2 forem duas cópias independentes e identicamente distribuídas como W, então a soma W1 + W2 seguirá distribuição normal com média igual a R$ 20 mil e desvio padrão igual a R$ 8 mil.
ERRADO.
W ~N(10,4)
E (w1 + w2), logo a variância será ao quadrado, passando a ser: W ~N(10,16)
Var (w1 + w2) = Var (w1) + Var (w2) + 2.Cov (w1.w2)
E (w1 + w2) = E(w1) + E(w2) = 10+ 10 = 20
Var (w1 + w2) = 16 + 16 + 2.Cov (w1.w2)
Var (w1 + w2) = 16 + 16 + 2.0
Var (w1 + w2) = 16 + 16 + 0
Var (w1 + w2) = 32
Dp (w1 + w2) = √32. Logo, a questão está errada.
(SEFAZ/BA/FFC/2019) Durante um período de tempo, registrou-se em uma fábrica a quantidade diária de óleo (Q) em litros consumida para a produção de um produto.
Concluiu-se que a população formada por estas quantidades é normalmente distribuída com média igual a 50 litros por dia. Sabe-se que 5% dos valores destas quantidades são inferiores a 41,8 litros e 90% possuem um valor de no máximo x litros. O valor de x é igual a
Dados: Valores das probabilidades P(Z ≤ z) da curva normal padrão Z.
a. 58,2
b. 56,4
c. 59,8
d. 57,3
e. 54,2
LETRA B.
Em litros = variável quantitativa contínua.
P(Z ≤ z)
1º momento:
µ = 50
x = 41,8
Z = (X - μ) / σ
-1,64 = (41,8-50)/ σ
σ = 5
X ~N(50, …)
Z ~N(0, 1)
No máximo, 90% (valor acumulado)
2º momento:
Z = (X - μ) / σ
1,28 = (X-50)/ σ
Encontrando o desvio padrão:
1,28 = (X-50)/ 5
X= 56,4
(FCC/2019/SEMEF/MANAUS-AM/AUDITOR FISCAL DE TRIBUTOS MUNICIPAIS) Uma grande população formada pelos comprimentos de determinadas peças é normalmente distribuída com média μ igual a 20 centímetros. Observa-se que 84% das peças da população possuem um comprimento inferior a 25 centímetros.
Dados: Escore reduzido da curva normal padrão (Z) tal que a probabilidade
P(0 < Z < z) = α.
Se 90% das peças possuem um comprimento superior a x centímetros, então, x é igual a:
a. 12,2.
b. 13,6.
c. 11,8.
d. 15,8.
e. 14,7.
LETRA B.
Comprimento = quantitativa contínua.
μ = 20 cm
P(x < 25 cm) = 0,84
P (Z < z) = 0,84
A distribuição normal é SIMÉTRICA.
P = α
A probabilidade é dada na tabela do exercício (α na área de baixo da curva) e o que exercício pede é que se encontre o Z, sabendo que o Z é maior que 0 e menor que z.
Z = 1, pois a outra metade da área equivale a 34% (0,34).
Encontrar o desvio padrão:
Z = (X - μ) / σ
1 = (25-20)/σ
σ = 5
P(0 < Z < z) = α
-1,28 = (X-20)/5
X= 13,6
É necessário saber ler a distribuição normal e esta vem do teorema do limite central.
Os valores 0,34 a 0,40 referem-se do meio da distribuição até onde o exercício demonstra.