Análise Estatística Flashcards by Julia Ferreira

Critério para haver intervalo de confiança

A amostragem deve ser probabilística

How well did you know this?

Not at all

Perfectly

Amostra aleatória simples x estratificada x sistemática x cluster

São tipos de amostragem probabilística
Simples: pop homogênea
Estratificada: “simples” dentro de grupos (proporcional ou uniforme)
Sistemática: sorteia-se 1 e, após, em intervalos fixos.
Cluster: dentro de mini-populações, bom para pop muito grande.

How well did you know this?

Not at all

Perfectly

Amostragem por cotas x julgamento x conveniência

Tipos de amostragem não probabilística
Cotas: pop dividida por características
Julgamento: definida por perito
Conveniência: o que é mais fácil para o pesquisador

How well did you know this?

Not at all

Perfectly

Tipos de variáveis quanti e qualitativas

Quanti: contínua (números quebrados) e discreta (números inteiros)
Quali: nominal ou ordinal

How well did you know this?

Not at all

Perfectly

Qual medida de tendência central não é afetada por valores extremos

A moda

How well did you know this?

Not at all

Perfectly

O que é desvio-padrão?

É a raiz quadrada da variância.

Medida de dispersão

How well did you know this?

Not at all

Perfectly

Curva de Gauss: onde está 95% da amostra

Média +- 1,96 desvios-padrão

How well did you know this?

Not at all

Perfectly

Curva de Gauss: média +- 1,2 e 3 desvios-padrão representam qual % da amostra?

+- 1: 68%
+- 2: 95%
+- 3: 99%

How well did you know this?

Not at all

Perfectly

Histograma: tipo de variável?

É obrigatório o uso de variáveis contínuas

How well did you know this?

Not at all

Perfectly

Box-plot: como construir?

Valor máximo de entrada -> quartil Q1 -> Q2 (mediana) -> Q3 -> valor mínimo de entrada

How well did you know this?

Not at all

Perfectly

Hipótese nula e hipótese alternativa?

Quais são os testes de hipótese?

Nula: não há diferença estatística entre os grupos.
Alternativa: há diferença estatística entre os grupos (a amostra é diferente da população)

Aceitar a hipótese nula: acredito que a diferença entre os grupos ocorreu devido ao acaso.
Rejeitar a hipótese nula: acredito que realmente a amostra foge do padrão usual da população

How well did you know this?

Not at all

Perfectly

Erros tipo I e tipo II?

Como fazer para reduzi-los?

Tipo I (alfa): rejeitei a hipótese nula quando, na verdade, ela era verdadeira.
Tipo II (beta): aceitei a hipótese nula quando, na verdade, ela era falsa.

Para minimizá-los, é preciso de um n muito grande (idealmente: toda a população)

How well did you know this?

Not at all

Perfectly

O que é o alfa?

É a probabilidade de se cometer o erro tipo I (rejeitar a hipótese nula quando, na verdade, ela é verdadeira). Ou seja, é a probabilidade de o resultado do estudo ser devido ao acaso (na verdade, não há diferença).

How well did you know this?

Not at all

Perfectly

O que é o p-valor?

Tem como limite o valor de alfa.
Se p < alfa, o resultado é significativo (dificilmente o resultado se deu pelo acaso, logo, deve mesmo haver diferença entre os grupos). Posso rejeitar a hipótese nula com mais segurança.

How well did you know this?

Not at all

Perfectly

Relação entre alfa e intervalo de confiança

Alfa = 1-IC

Habitualmente, IC = 95% e alfa = 5%

How well did you know this?

Not at all

Perfectly

O que significa ter um IC muito estreito ou muito amplo?

Quanto mais amplo, menor foi o n do estudo.

Um IC estreito reflete um teste mais preciso, com maior amostra.

Chance x risco?

Chance: diz respeito à presença de associação. OR.
Risco: se refere a ser, de fato, um risco. RR etc.

Se o RR é de 0,6, em quantas vezes o risco for reduzido?

Em 40% (1-0,6 = 0,4)

Se o RR é de 1,3, em quantas vezes o risco foi aumentado?

Em 30% (1,3 - 1 = 0,3)

Se o RR é de 3,4, em quantas vezes o risco foi aumentado?

Em 340%

Como calcular a redução absoluta do risco

RAR = INE - IE

Se for aumento absoluto do risco: IE - INE

Como calcular a redução relativa do risco

RRR = 1-RR

Como calcular o número necessário para tratar?

Número necessário para dano?

NNT = 1/RAR
NND = 1/AAR

Como calcular o risco atribuível ao fator

RAF = IE - INE

Como calcular o risco atribuível na população?

RAP = ITOTAL - INE

Qual é a Fração de Risco Atribuível ao Fator (percentual)?

%RAF = RAF / IE ou RR-1/RR

Qual é a Fração de Risco Atribuível na População (percentual)?

%RAP = RAP/ITOTAL

Critério obrigatório para uma amostra pareada/dependente?

O número de indivíduos deve ser igual entre as amostras! | Eles devem ser idênticos ou, pelo menos, terem características parecidas.

O que é uma distribuição paramétrica?

Segue a curva de Gauss

Testes possíveis para estudos que comparam variáveis quali x quanti

2 grupos distrib paramétrica: teste T pareado ou teste T não pareado (student) 2 grupos distrib não-paramétrica: Wilcoxon (pareado) ou Mann-Whitney-U (não pareado) 3/+ grupos paramétrica: ANOVA (pareado) ou MANOVA (não pareado) 3/+ grupos não-paramétrica: Friedman (pareado) ou Kruskall-Wallis (não pareado)

Testes possíveis para estudos que comparam variáveis quali x quali

``` Amostra pequena (n<5): Exato de Fisher Amostra grande (n > ou = 5): Qui-quadrado ```

Testes possíveis para estudos que comparam variáveis quanti x quanti

Regressão linear. Distribuição paramétrica: Correlação de Pearson Distribuição não paramétrica: Correlação de Spearman

Para definir entre Exato de Fisher e Qui-Quadrado, como calcular o n esperado numa tabela 2x2

Multiplicar o total da linha pelo total da coluna e dividir pela amostra total. Fazer isso para todas as células. Se todas tiverem um resultado > ou = 5, é pra usar o Qui-Quadrado. Se alguma tiver resultado < 5, usa-se o Exato de Fisher

Como verificar se um estudo tem distribuição normal ou não?

Aplicando teste de normalidade, como o Kolmogorov-Smirnov. Se nada disso for falado na questão, considerar que é normal (paramétrico)

O que é intervalo interquartílico?

Q3-Q1. Medida de dispersão que avalia o quão distribuídos estão os 50% intermediários. A vantagem sobre o desvio-padrão é que é bem pouco afetado por valores extremos