Análise Estatística Flashcards
Critério para haver intervalo de confiança
A amostragem deve ser probabilística
Amostra aleatória simples x estratificada x sistemática x cluster
São tipos de amostragem probabilística
Simples: pop homogênea
Estratificada: “simples” dentro de grupos (proporcional ou uniforme)
Sistemática: sorteia-se 1 e, após, em intervalos fixos.
Cluster: dentro de mini-populações, bom para pop muito grande.
Amostragem por cotas x julgamento x conveniência
Tipos de amostragem não probabilística
Cotas: pop dividida por características
Julgamento: definida por perito
Conveniência: o que é mais fácil para o pesquisador
Tipos de variáveis quanti e qualitativas
Quanti: contínua (números quebrados) e discreta (números inteiros)
Quali: nominal ou ordinal
Qual medida de tendência central não é afetada por valores extremos
A moda
O que é desvio-padrão?
É a raiz quadrada da variância.
Medida de dispersão
Curva de Gauss: onde está 95% da amostra
Média +- 1,96 desvios-padrão
Curva de Gauss: média +- 1,2 e 3 desvios-padrão representam qual % da amostra?
+- 1: 68%
+- 2: 95%
+- 3: 99%
Histograma: tipo de variável?
É obrigatório o uso de variáveis contínuas
Box-plot: como construir?
Valor máximo de entrada -> quartil Q1 -> Q2 (mediana) -> Q3 -> valor mínimo de entrada
Hipótese nula e hipótese alternativa?
Quais são os testes de hipótese?
Nula: não há diferença estatística entre os grupos.
Alternativa: há diferença estatística entre os grupos (a amostra é diferente da população)
Aceitar a hipótese nula: acredito que a diferença entre os grupos ocorreu devido ao acaso.
Rejeitar a hipótese nula: acredito que realmente a amostra foge do padrão usual da população
Erros tipo I e tipo II?
Como fazer para reduzi-los?
Tipo I (alfa): rejeitei a hipótese nula quando, na verdade, ela era verdadeira. Tipo II (beta): aceitei a hipótese nula quando, na verdade, ela era falsa.
Para minimizá-los, é preciso de um n muito grande (idealmente: toda a população)
O que é o alfa?
É a probabilidade de se cometer o erro tipo I (rejeitar a hipótese nula quando, na verdade, ela é verdadeira). Ou seja, é a probabilidade de o resultado do estudo ser devido ao acaso (na verdade, não há diferença).
O que é o p-valor?
Tem como limite o valor de alfa.
Se p < alfa, o resultado é significativo (dificilmente o resultado se deu pelo acaso, logo, deve mesmo haver diferença entre os grupos). Posso rejeitar a hipótese nula com mais segurança.
Relação entre alfa e intervalo de confiança
Alfa = 1-IC
Habitualmente, IC = 95% e alfa = 5%
O que significa ter um IC muito estreito ou muito amplo?
Quanto mais amplo, menor foi o n do estudo.
Um IC estreito reflete um teste mais preciso, com maior amostra.
Chance x risco?
Chance: diz respeito à presença de associação. OR.
Risco: se refere a ser, de fato, um risco. RR etc.
Se o RR é de 0,6, em quantas vezes o risco for reduzido?
Em 40% (1-0,6 = 0,4)
Se o RR é de 1,3, em quantas vezes o risco foi aumentado?
Em 30% (1,3 - 1 = 0,3)
Se o RR é de 3,4, em quantas vezes o risco foi aumentado?
Em 340%
Como calcular a redução absoluta do risco
RAR = INE - IE
Se for aumento absoluto do risco: IE - INE
Como calcular a redução relativa do risco
RRR = 1-RR
Como calcular o número necessário para tratar?
Número necessário para dano?
NNT = 1/RAR NND = 1/AAR
Como calcular o risco atribuível ao fator
RAF = IE - INE
Como calcular o risco atribuível na população?
RAP = ITOTAL - INE
Qual é a Fração de Risco Atribuível ao Fator (percentual)?
%RAF = RAF / IE ou RR-1/RR
Qual é a Fração de Risco Atribuível na População (percentual)?
%RAP = RAP/ITOTAL
Critério obrigatório para uma amostra pareada/dependente?
O número de indivíduos deve ser igual entre as amostras!
Eles devem ser idênticos ou, pelo menos, terem características parecidas.
O que é uma distribuição paramétrica?
Segue a curva de Gauss
Testes possíveis para estudos que comparam variáveis quali x quanti
2 grupos distrib paramétrica: teste T pareado ou teste T não pareado (student)
2 grupos distrib não-paramétrica: Wilcoxon (pareado) ou Mann-Whitney-U (não pareado)
3/+ grupos paramétrica: ANOVA (pareado) ou MANOVA (não pareado)
3/+ grupos não-paramétrica: Friedman (pareado) ou Kruskall-Wallis (não pareado)
Testes possíveis para estudos que comparam variáveis quali x quali
Amostra pequena (n<5): Exato de Fisher Amostra grande (n > ou = 5): Qui-quadrado
Testes possíveis para estudos que comparam variáveis quanti x quanti
Regressão linear.
Distribuição paramétrica: Correlação de Pearson
Distribuição não paramétrica: Correlação de Spearman
Para definir entre Exato de Fisher e Qui-Quadrado, como calcular o n esperado numa tabela 2x2
Multiplicar o total da linha pelo total da coluna e dividir pela amostra total.
Fazer isso para todas as células.
Se todas tiverem um resultado > ou = 5, é pra usar o Qui-Quadrado.
Se alguma tiver resultado < 5, usa-se o Exato de Fisher
Como verificar se um estudo tem distribuição normal ou não?
Aplicando teste de normalidade, como o Kolmogorov-Smirnov.
Se nada disso for falado na questão, considerar que é normal (paramétrico)
O que é intervalo interquartílico?
Q3-Q1.
Medida de dispersão que avalia o quão distribuídos estão os 50% intermediários.
A vantagem sobre o desvio-padrão é que é bem pouco afetado por valores extremos