Teste 1 Flashcards
Num teste de valor médio com 1 amostra e com desvio-padrão desconhecido, a estatística de teste usada deverá ser um teste ___.
t
Num teste de valor médio com 1 amostra e com desvio-padrão conhecido, a estatística de teste usada deverá ser um teste t. Verdadeiro ou Falso?
Falso
Num teste de valor médio com 2 amostras independentes e com desvios-padrão desconhecidos, mas sabidos iguais, a estatística de teste usada deverá ser um teste ___.
t
Num teste de valor médio com 2 amostras independentes e com desvios-padrão desconhecidos, mas sabidos diferentes, que teste deverá ser aplicado?
O teste de Welch. Quando as amostras têm pequenas dimensões, pode usar-se a aproximação de Welch-Satterthwaite.
Num teste de valor médio com 2 amostras independentes e com desvios-padrão conhecidos, a estatística de teste usada deverá ser um teste ___.
z
Num teste para as variâncias com 2 amostras independentes, qual teste deverá ser aplicado?
O Fisher-Snedecor
O teste t de Welch foi projetado para variâncias populacionais desiguais, mas a suposição de normalidade é mantida. Verdadeiro ou Falso?
Verdadeiro
Ao contrário do teste t-Student, no teste de Welch, a variância no denominador não é baseada numa ponderação das variâncias dos dois grupos. Verdadeiro ou Falso?
Verdadeiro
Num teste para os valores médios com 2 amostras independentes e uma população não normalmente distribuída mas de grandes dimensões (n >= 30), assume-se a aproximação a uma população normal e as estatística de teste usadas deverão ser diferentes. Verdadeiro ou Falso?
Falso
Em que situações se usa o teste de Levene?
Para comparar as variâncias de mais do que 2 amostras independentes normalmente distribuídas.
O teste de Levene é menos sensível a desvios do pressuposto de normalidade do que o teste de ___________.
Bartlett
O teste para o valor médio de 2 amostras emparelhadas faz-se com recurso à _____________ entre as amostras.
diferença
Em amostras pequenas, quando ambas as amostras emparelhadas são normais, isso não quer dizer que a diferença o seja. Verdadeiro ou Falso?
Verdadeiro
Quando as amostras são emparelhadas, é preciso testar-se as variâncias. Verdadeiro ou Falso?
Falso
Em amostras inferiores a _____, usamos o teste Shapiro-Wilk para testar a ______________.
50; normalidade
Se as amostras forem normais e as variâncias forem diferentes, usa-se o __________________.
Kruskal-Wallis
Se as amostras não forem normais, mas as variâncias forem iguais, usa-se a ___________.
ANOVA
Os testes não-paramétricos têm mais ‘força’ estatística do que os paramétricos. Verdadeiro ou Falso?
Falso
Os testes não-paramétricos são, normalmente, usados para amostras ______________, não ___________ e cujos dados são ordinais ou não quantitativos.
pequenas; normais
As variáveis quantitativas podem ser _____________ e discretas.
contínuas
As variáveis qualitativas podem ser nominais e ____________.
ordinais
Os níveis de medida indicam a ____________ com que são registadas as observações relativamente às variáveis em estudo.
precisão
O nível de medida de uma variável determina como podemos analisar os dados. Verdadeiro ou Falso?
Verdadeiro
Quantos níveis de medida existem?
4
- Escala Nominal
- Escala Ordinal
- Escala Intervalar (ou de unidades iguais)
- Escala de Razão ou Proporcional
Qual é o nível de medida que está apto a todos os níveis de comparações?
Escala de Razão ou Proporcional
A maioria das variáveis quantitativas encontram-se na escala de razão ou proporcional. Verdadeiro ou Falso?
Verdadeiro
A escala intervalar permite comparações através de razões. Verdadeiro ou Falso?
Falso
Na escala intervalar, 0 significa ausência. Verdadeiro ou Falso?
Falso
A única comparação que se pode fazer na escala intervalar é pela _____________.
diferença
Na escala de Razão ou Proporcional, o 0 tem existência ____________ e significa ausência da caraterística a medir.
absoluta
Faça as correspondências seguintes:
- Erro (Tipo I) - ALFA
- Erro (Tipo II) - BETA
A) Falso-positivo
B) Falso-negativo
1.A)
2.B)
É possível diminuir simultaneamente a probabilidade dos 2 tipos de erro. Verdadeiro ou Falso?
Falso
Qual é o tipo de erro mais grave?
Erro do Tipo I
O p-value é independente do tamanho da amostra. Verdadeiro ou Falso?
Falso
O p-value dá-nos que tipo de informação?
É a probabilidade de a diferença observada entre 2 grupos ser devida ao acaso. Alternativamente, é a probabilidade de se obter, sob H0, um valor de estatística de teste tão extremo, ou ainda mais extremo (na direção apropriada), do que o valor observado.
A significância estatística é função do _____________ da amostra.
tamanho
Significância estatística e significância prática são sinónimos. Verdadeiro ou Falso?
Falso
A significância estatística é comparável. Verdadeiro ou Falso?
Falso
p -value = 0.049 e p-value = 0.050 têm significâncias estatísticas diferentes. Verdadeiro ou Falso?
Falso
Se a diferença não for significativa, não significa que o tratamento não funcionou. Significa que o acaso com uma explicação com 95% de confiança não pode ser descartada. Verdadeiro ou Falso?
Verdadeiro
O p-value não nos dá informação sobre o quê?
Não nos diz se os resultados são praticamente significativos, não nos diz quão grande é o efeito ou se algo é ‘mais’ ou ‘menos’ significativo.
O que é a correção de Bonferroni?
Dá-nos informação sobre o nível de significância a usar. 0.05/n, sendo n o número de testes a realizar.
Não é possível diminuir ambos os tipos de erros através da recolha de mais dados. Verdadeiro ou Falso?
Falso
A principal vantagem de usar um teste unilateral é que ele tem mais _________ estatístico do que um teste bilateral ao mesmo nível de significância. Ou seja, é mais provável que os resultados sejam significativos para um teste ______________ se realmente houver uma diferença entre os grupos na direção que se previu. Isso ocorre porque apenas uma __________ da distribuição é usada para o teste.
poder; unilateral; cauda
A ANOVA é mais sensível à não-normalidade do que a diferentes variâncias. Verdadeiro ou Falso?
Falso
The Kolmogorov-Smirnov test is applied when one wants to check if the sample comes from a population with a certain theoretical distribution. True or False?
True
Quando os parâmetros da distribuição não são conhecidos, em vez do teste de Kolmogorov-Smirnov, usa-se que teste?
É o teste de Lilliefors.
(Only different critical value tables are needed, which vary depending on the family of theoretical distributions F(.) considered.)
Quais são as vantagens de usar o Kolmogorov-Smirnov em vez do teste do Qui-Quadrado?
- Does not require data to be grouped into classes, unlike the chi-squared test.
- There is no waste of information.
- Can be used when the sample size is small.
Quais são as vantagens de usar o Qui-Quadrado em vez do teste do Kolmogorov-Smirnov?
- Is applicable to test the fit to discrete distributions (e.g.: Binomial and Poisson) or continuous distributions (e.g. Normal and Exponential).
- It can be used when the parameters of the distribution indicated in H0 are unknown and must be estimated from the data.
O teste de Wald-Wolfowitz tem outro nome. Qual é?
Runs test - testa a aleatoriedade das amostras
For the sign test, data should be at least __________ scale, the variable of interest must be _____________ and the test considers the median, rather than the mean, as the location parameter.
ordinal; continuous
O que é que distingue o Mann-Whitney U-test do Wilcoxon Signed-Rank test?
O primeiro é aplicado quando temos 2 amostras independentes e o segundo é aplicado quando temos 2 amostras emparelhadas.
O Mann-Whitney U-test é considerado o equivalente não-paramétrico do teste ____ para 2 amostras independentes.
t
In the case of tied observations in Mann-Whitney U-test and in _____________ Signed-Rank test, assign to those observations the __________ ranks that would be assigned if there were no ties.
Wilcoxon; average
In Wilcoxon Signed-Rank test, differences are assumed to be _______________ and measured on at least an ordinal scale. It pressuposes that the population underlying the sample of differences is ______________ around its median.
independent; symmetric
In Wilcoxon Signed-Rank test, differences = 0 are ____________ from the analysis, and the sample size is reduced by the number of ________ with zero differences.
removed; pairs
O teste ___ do Shapiro-Wilk mede quão bem a amostra coincide com a distribuição normal.
W
The Shapiro-Wilk test is highly ___________ to deviations from ________________, especially for __________ sample sizes. The test is applicable to ______________ data and works best with small to moderate sample sizes.
sensitive; normality; small; continuous
Qual é a diferença entre o Kruskal-Wallis test e o Friedman test?
O primeiro é usado para mais do que 2 amostras independentes e o segundo é usado em mais do que 2 amostras emparelhadas. Ambos os testes têm o objetivo de inferir se as distribuições a ser comparadas são idênticas.
The _________________ test is the non-parametric equivalent to one-way ANOVA.
Kruskal-Wallis
In the Kruskal-Wallis test, the variables of interest are _____________ and the data are recorded at least on an ____________ scale.
continuous; ordinal
The _____________ test is the non-parametric ANOVA with completely randomised blocks.
Friedman
Qual é a diferença entre os testes do Qui-Quadrado e o de Fisher?
São ambos usados para testar a independência das variáveis em estudo, mas o Fisher’s test é usado para tabelas de contingência 2x2.
McNemar’s test is applicable to situations of the type ‘before’ vs ‘after’ the application of a treatment or stimulus - paired samples. True or False?
True
In the McNemar’s test, only ____________ pairs are of actual interest.
discordant
The Crámer’s C Coefficient measures the degree of association between 2 sets of attributes or variables. It is only useful when we have _____________ variables. It has a maximum value of 1 and is equal to ____ when the variables or attributes are independent.
categorical; 0
Se o coeficiente C de Crámer for superior à probabilidade de X^2 ser maior ou igual ao valor resultante da estatística de teste, que conclusão tiramos?
As duas variáveis não são independentes, porque C é significativamente diferente de 0.
Um método/teste que rejeite menos vezes H0 é mais ______________.
conservador
The size of the rejection region is ___________.
alfa
No teste para o valor médio de uma amostra, quando o desvio-padrão é conhecido, o teste z é aproximado por uma distribuição ___________ N(0,1). Quando é desconhecido, usamos o teste ____ e é aproximado a uma distribuição _____________ com _______ graus de liberdade.
normal; t; t-Student; n-1
Se o p-value = alfa, o que se conclui?
Rejeita-se H0.
No teste do qui-quadrado para testar a variância de uma amostra independente, a estatística de teste aproxima-se da distribuição do Qui-Quadrado com _____________ graus de liberdade.
n-1
Quando se quer testar a igualdade dos valores médios de duas amostras independentes normalmente distribuídas e os desvio-padrão são desconhecidos, mas iguais, que teste usamos?
O pooled variance t-test.
No pooled variance t-test, como é que se calcula o número de graus de liberdade?
Sen X e Y as duas amostras em estudo:
g.l. = n_X + n_Y - 2.
Para testar os valores médios de duas amostras independentes não normalmente distribuídas, mas de grandes dimensões, que teste se usa quando os desvios-padrão são desconhecidos?
Faz-se o teste de Welch, mas, neste caso, a estatística de teste é aproximada, assintoticamente, a uma distribuição normal N(0,1).
Para testar os valores médios de duas amostras independentes não normalmente distribuídas, mas de grandes dimensões, que teste se usa quando os desvios-padrão são conhecidos?
Realiza-se, de igual modo, o teste z para duas amostras independentes (com a estatística de teste a aproximar-se, assintoticamente, de uma distribuição normal N(0,1)).
A distribuição de Fisher-Snedecor está associada a um único número de graus de liberdade. Verdadeiro ou Falso?
Falso. Cada uma das 2 amostras em estudo tem um número de graus de liberdade associado (n-1).
As regiões críticas de testes para as variâncias, no intervalo inferior, começam em menos infinito. Verdadeiro ou Falso?
Falso. Começam em 0.
No teste de Levene, a estatística de teste segue uma distribuição _____ com k-1 e n-k graus de liberdade. k é o número de ___________ e n é a ____________ _________.
F; amostras; dimensão total
O teste ANOVA I é intrinsecamente one-sided. Verdadeiro ou Falso?
Verdadeiro. Acima.
A estatística de teste da ANOVA I segue uma distribuição F com que números de graus de liberdade?
k - 1
n - k
Com k a ser o número de tratamentos/amostras e n a ser o número total de observações.
Numa situação em que a variância entre grupos é ____________ à variância dentro de cada grupo, é possível que não se rejeite a igualdade dos valores médios.
inferior
Quantos números de graus de liberdades estão associados à distribuição q (Studentized Range)?
1 (n - k)
O teste de Wald-Wolfowitz é aplicável a mais do que uma amostra. Verdadeiro ou Falso?
Falso
A amostra em estudo no teste de Wald-Wolfowitz deve ser ________________.
dicotomizada
A sequence is a set of identical symbols that are preceded and followed by different symbols, or by no symbol. True or False?
True
The runs test is based on the fact that a low number of sequences, or an excessively high number of sequences, indicates a lack of randomness. True or False?
True
For a small sample, there are tables that provide the __________ values of the test statistic for the runs test or the corresponding ____________.
critical; p-value
For small samples, the exact distribution of the test statistic, _____, is a discrete distribution based on the total number of possible arrangements of the binary sequence (+s and -s). The exact distribution is obtained by calculating the probability of each possible number of runs using combinatorial calculations.
R
O que fazer quando queremos aplicar o teste de Wald-Wolfowitz e a nossa amostra não é dicotomizada?
Geralmente, dicotomiza-se a amostra usando a mediana.
- Sinais + acima da mediana;
- Sinais - abaixo da mediana;
- Quando há observações que coincidem com a mediana, inclui-se no grupo dos sinais -.
No signs test, a variável de interesse deve ser discreta. Verdadeiro ou Falso?
Falso
Observations that coincide with m0 should be rejected from the analysis. The sample size will be reduced accordingly. Which test are we talking about?
The signs test.
The test statistic, ____, for the signs test is the minimum between the total number of + signs and the number of - signs. Under H0 the distribution of the statistic T follows a ______________ distribution with parameters n (number of valid observations) and p = ________ (p(+) = p(-) = 1/2). For __________ sample sizes, we can use the exact binomial test. For _________ n, the ____________ distribution approximation can be used.
T; Binomial; 0.5; small; large; normal
Que outro nome pode ter o Mann-Whitney U Test?
Wilcoxon rank-sum test
The Mann-Whitney U Test is considered the non-parametric equivalent of the __________ for 2 independent random samples.
t-test
The Mann-Whitney U Test requires data at least on an __________ scale and the observed variable to be ___________.
ordinal; continuous
O teste de Mann-Whitney usa ranks. Verdadeiro ou Falso?
Verdadeiro
Como é que se procede quando há observações empatadas no Mann-Whitney U Test?
Essas observações devem assumir as ranks médias que receberiam se não houvesse empates.
In the Mann-Whitney U Test, for small sample sizes, there are tables that provide the critical values of U or the p-value. True or False?
True
No caso de haver grandes valores de n1 e n2 ou de haver uma grande percentagem de empates, a estatística de teste do Mann-Whitney U Test aplicada é a mesma. Verdadeiro ou Falso?
Falso
The Wilcoxon Signed-Rank Test assumes that the ____________ represent observations from a ________________ random variable. It presupposes that the population underlying the sample of differences is _____________ around its ___________.
differences; continuous; symmetric; median
It is assumed that the differences are dependent and measured on at least an ordinal scale. True or False?
False. The differences are independent.
Ordene os seguintes passos de aplicação do Wilcoxon Signed-Rank Test.
A) Assign ranks to all differences (in absolute value) that are not zero.
B) Sum the ranks assigned to positive (or negative) differences according to the alternative hypothesis.
C) In the case of tied observations, the average of the ranks that would have been assigned if there were no ties is assigned to the observations.
D) Order the sample of differences, in absolute value, from smallest to largest.
E) Assign signs - or + to the ranks according to whether they come from negative or positive differences, respectively.
F) Differences that are zero are removed from the analysis, and the sample size, n, is reduced by the number of pairs with zero differences.
D - F - A - C - E - B
In the Wilcoxon Signed-Rank Test, for large values of n, calculate the critical region of the test or the p-value using the _________ distribution.
When n is _________, there are tables that provide the __________ value (which will define the critical region of the test) or the p-value.
normal; small; critical
The Kolmogorov-Smirnov test assumes the _____________ reference distribution F(.) is ______________.
theoretical; continuous
In what conditions does the Kolmogorov-Smirnov test become conservative?
- The theoretical distribution is discrete.
- The parameters of the distribution considered to be suitable are estimated from the sample.
Which test is based on finding the maximum observed vertical distance between the theoretical distribution function and the empirical distribution function?
The Kolmogorov-Smirnov test.
The test statistic of the Kolmogorov-Smirnov test is ______ and converges to Kolmogorov distribution as the sample size _____________.
D; increases
What happens when the parameters of the theoretical distribution indicated in H0 are unknown?
We need to estimate the population parameters using the sample and the test to be used is referred to as the Lilliefors test.
Qual é a diferença entre o teste de Kolmogorov-Smirnov e o teste de Lilliefors?
Apenas as tabelas de valores críticos são diferentes e variam dependendo das distribuições teóricas que se estiverem a testar.
O teste de Shapiro-Wilk tem uma grande capacidade de detetar ________________.
não-normalidade
The Shapiro-Wilk test compares the sample’s _________ statistics to the expected values from a ____________ distribution. The cutoff values for the statistics are calculated through _________ _________ simulations.
order; normal; Monte Carlo
Qual é a estatística de teste do Shapiro-Wilk?
W
The _____________ test is highly sensitive to deviations from normality, especially for small sample sizes.
Shapiro-Wilk
The _______________ test is applicable to continuous data and works best with small to moderate sample sizes.
Shapiro-Wilk
The maximum vertical distance between F_N(x) and F(x) may not occur at an observed point in the sample. To calculate D correctly, we must also consider|F_N(x_(i-1)) - F(xi)|, for all values of i 1,2,…,r, where r is the number of ___________ __________present in the sample of size n.
distinct values
The ______________ is the generalisation of the Mann-Whitney U Test for k > 2 independent samples.
Kruskal-Wallis
Kruskal-Wallis is more sensitive to outliers than ANOVA. True or False?
False
The Kruskal-Wallis test assumes observations are independent both within and between samples. True or False?
True
Ordene os seguintes passos de aplicação do Kruskal-Wallis Test.
A) Sum the ranks assigned to the elements of each sample.
B) Order the observations, xij, from smallest to largest and assign corresponding ranks, Rij.
C) Let xij be the i-th observation of the j-th sample, i 1,2,…,nj and j 1,2,…,k.
D) In case of tied observations, assign the mean of the ranks that would have been assigned if there were no ties to those observations.
C - B - D - A
A estatística de teste para o Kruskal-Wallis é a H. Verdadeiro ou Falso?
Verdadeiro
Sob H0, H aproxima-se, assintoticamente, da distribuição Qui-Quadrado com k-1 graus de liberdade. k corresponde ao número de _____________ em estudo.
amostras/tratamentos
The multiple comparisons after the rejection of H0 using the Kruskal-Wallis test are done by performing the _____________ test on all pairs of treatments, adjusting ___________ to alfa/c, where c is the number of ______________. This is an example of the ________________ procedure.
Wilcoxon rank-sum (Mann-Whitney U); alfa; comparisons; Bonferroni
In the Friedman test, there is no interaction between _____________ and blocks. The interest is in comparing the distributions of the ___ populations. k treatments (related samples) are considered applied to mutually independent blocks.
treatments; k
Ordene os seguintes passos de aplicação do Friedman Test.
A) Sum the ranks corresponding to each treatment.
B) Order the observations in each block.
C) Let Rij be the rank assigned to the j-th observation recorded in the i-th block and Rj be the sum of the ranks assigned to the observations of the j-th sample as shown in the following table.
D) Assign ranks from 1 to k for each block.
B - D - A - C
Under H0, the Fr test statistic approximately follows a chi-squared distribution with ________ degrees of freedom.
k - 1
No teste do qui-quadrado, só há uma população. Verdadeiro ou Falso?
Verdadeiro
Como é que se determina o número de graus de liberdade na aplicação do teste do qui-quadrado (para testar independência de variáveis)?
(c - 1)(k - 1)
c: número de linhas da tabela de contingência
k: número de colunas da tabela de contingência
In the Fisher’s Exact Test, we can calculate the probability of the observed table using the ____________________ distribution.
hypergeometric
The categories for the Fisher’s Exact Test should be mutually exclusive. True or False?
True
Fisher’s Exact Test: For very ___________ values of n, it is possible to calculate the probability of observing a result as extreme or more extreme than the observed, under the null hypothesis that has been formulated.
small
In practical terms, Fisher’s exact test is usually used as an alternative to the chi-square test when the samples are very ___________, even when both marginal totals are not __________.
small; fixed
O nível de medida dos dados, para aplicação do teste de McNemar, é _____________ com duas categorias.
nominal
(1,0) is considered a success and (0,1) is a failure. True or False?
False
(0,1) - success
(1,0) - failure
McNemar’s Test:
Under H0, __________ corresponds to the expected number of individuals who change their response due to the application of the treatment or stimulus.
(b+c)/2
Quando n(= b + c) é inferior ou igual a 20, o número de pares cuja resposta é (0,1) segue uma distribuição ___________ com p = _______.
Quando n > 20, a estatística de teste segue uma distribuição _______________ com 1 grau de liberdade.
Binomial; 1/2; qui-quadrado
Podemos recorrer também à distribuição normal, para aplicação do teste de McNemar, quando n > 20. Verdadeiro ou Falso?
Verdadeiro
O valor-p é a probabilidade de a amostra ocorrer por acaso. Verdadeiro ou Falso?
Falso
Um valor-p pequeno indica-nos que existe evidência para não rejeitar a hipótese nula. Verdadeiro ou Falso?
Falso
O valor-p é uma medida da consistência da amostra relativamente à hipótese nula. Verdadeiro ou Falso?
Verdadeiro
À luz da teoria dos testes de hipóteses, qual das seguintes afirmações é verdadeira:
A. Um teste de hipóteses ajuda-nos a calcular a probabilidade de a hipótese nula ser verdadeira com base nos dados amostrais disponíveis.
B. Um teste de hipóteses ajuda-nos a calcular a probabilidade de a hipótese alternativa ser verdadeira com base nos dados amostrais disponíveis.
C. Um teste de hipóteses ajuda-nos a calcular a probabilidade de obter os dados observados se a hipótese nula for verdadeira.
D. Um teste de hipóteses ajuda-nos a calcular a probabilidade de obter os dados observados se a hipótese alternativa for verdadeira.
C
Alterar o nível de significância de 0.05 para 0.01 aumenta a probabilidade de cometer um:
A. erro do tipo I
B. erro do tipo II
C. erro do tipo III
D. não cometer erros
B
A estatística de teste é uma quantidade numérica, cujo valor depende apenas da amostra e de H0. Verdadeiro ou Falso?
Verdadeiro
Diminuir P[Erro Tipo I] tem que significado em termos estatísticos?
Ao diminuir a probabilidade de ocorrer um erro do tipo I, estamos a reduzir o conjunto de valores que levam à rejeição de H0 (e a aumentar a probabilidade de ocorrer um erro do tipo II).
É possível a hipótese nula ser completamente verdadeira. Verdadeiro ou Falso?
Falso
Rejeitar H0 prova de imediato que H1 está correcta. Verdadeiro ou Falso?
Falso
A probabilidade de ocorrer um falso-positivo diminui à medida que se realizam mais testes. Verdadeiro ou Falso?
Falso. Sobe. A resolução para este problema é aplicar a correção de Bonferroni.
Um valor-p é uma medida da incompatibilidade entre os dados observados e uma hipótese nula. Verdadeiro ou Falso?
Verdadeiro
Existem testes de hipóteses específicos para testagem sequencial. Verdadeiro ou Falso?
Verdadeiro
O papel das duas hipóteses em confronto é simétrico. Verdadeiro ou Falso?
Falso
Não há qualificador para a significância. Verdadeiro ou Falso?
Verdadeiro