Estudos Epidemiológicos - análise estatística 22/06 Flashcards
O que é amostragem probabilística?
Seleção da amostra de forma aleatória.
Isso garante que a amostra terá as mesmas características da população (o que aumenta a segurança das inferências).
Cite 2 vantagens da amostra probabilística.
- Garante que os resultados possam ser generalizados para a população
- Permite estimar o intervalo de confiança (unifesp)
Cite os 4 tipos de amostra probabilística (diferentes tipos de sortear).
- Aleatória simples ou ocasional ou randômica
- Aleatória estratificada
- Sistemática
- Por conglomerados ou cluster (usado em ensaio comunitário)
Seleção dos prontuários terminados em 7 para a utilização no estado.
Qual é esse tipo de amostra?
Amostra probabilística sistemática.
Ainda é um sorteio, porém com intervalos fixos.
Cite 2 amostras não probabilísticas.
Não são feitas ao acaso.
O investigar seleciona, sem sorteio.
- Por julgamentos
- Por conveniência
- Por cotas (seleciona a partir de características pré-definidas - estratégia de mercado)
Usados em estudos em que não tem interesse em extrapolar os resultados para a população.
Também usado em estudos qualitativos (pouco abordado)
Verdadeiro ou falso:
Amostras probabilísticas não têm interferência do investigador.
Verdadeiro.
Variável quantitativa contínua.
Números que podem assumir valor decimal.
Por exemplo: peso, glicemia, altura, etc.
Variável quantitativa discreta.
Números que não podem assumir valor decimal.
Por exemplo: quantidade de filhos, número de consultas, etc.
Variável qualitativa nominal.
Variáveis que não possuem valores numéricos e que não possuem ordenação entre as categorias.
Por exemplo, cor dos olhos, sexo, especialidade médica, etc.
Sinônimo de variável qualitativa
Variável categórica.
Variáveis “sim/não” pertencem a qual grupo?
Qualitativas nominais.
Variável qualitativa ordinal.
Não possuem valores numéricos, mas têm ordenação entre as categorias.
Por exemplo: estadiamento de câncer, faixa etária, grau de queimadura, escala de dor, etc.
É possível transformar variável quantitativa contínua em qualitativa ordinal?
Sim.
Por exemplo:
- variável numérica contínua: idades entre 20 - 60 anos.
transforme em qualitativa ordinal se escrever como faixa etária: 20-40 anos, 41-60 anos.
Cite as medidas de tendência central.
- Mediana
- Média
- Moda
Qual a medida de tendência central que mais se afasta do meio?
a média, porque depende da amplitude dos valores.
Qual a medida de tendência central que tem maior consistência matemática?
Média
Verdadeiro ou falso:
A moda e a mediana não se alteram com os valores extremos.
Verdadeiro.
Medidas de dispersão.
- Amplitude
- Variância
- Desvio padrão.
Nas provas, variância e desvio padrão são praticamente usados como sinônimos.
O que significa um alto valor de desvio padrão?
Significa que a distribuição é espalhada, ou seja, está dispersa: os valores se afastam muito da média.
Cálculo do desvio padrão (σ) .
(unifesp)
(σ) é a raiz quadrada da variância.
Cite 2 utilidades do desvio padrão.
- diagrama de controle
- curva de distribuição normal (curva de Gauss)
Qual o valor de 2 desvios-padrão.
(unifesp)
1,96.
Verdadeiro ou falso:
Na distribuição gaussiana, a moda, média e mediana têm o mesmo valor.
Verdadeiro.
Nas distribuições assimétricas, qual a medida mais representativa?
É a mediana.
Valores muito discrepantes afetam a média.
Na distribuição normal, qual a porcentagem de valores entre 2 desvio-padrão (para cima - para baixo)?
95% dos valores estão dispostos entre -2 σ e +2σ.
2/3 dos valores estão dispostos entre -1 σ e + 1σ.
Qual o tipo de distribuição da gravidez?
Assimétrica.
O que é o box-plot?
Tipo de gráfico que utiliza os quartis para representar uma população.
- quartil é como se fosse a mediana da mediana.
- na imagem abaixo, o Q2 é a própria mediana.
O que são erros aleatórios?
São erros que já são esperados que aconteçam.
Erros tipo I e II.
Como zerá-los? Só se utilizar a população e não amostragem.
Não confundir com viés (erro sistemático).
Erro tipo I.
Também chamado de α (alfa).
Também chamado de nível de significância.
É o falso negativo - é quando rejeitamos a hipótese nula quando na realidade ela é verdadeira.
Verdadeiro ou falso:
O valor de α é pré-determinado pelo pesquisador.
Verdadeiro.
Pode variar entre 1-10%. Geralmente, usa-se 5%.
Se queremos um IC 95%, o valor de α é 1 - 0,95 = 0,05 = 5%.
Qual a utilidade do p-valor?
Avaliar se o resultado do estudo foi significativo ou não.
Alfa estabelecido de 5%.
Se o estudo encontrou p-valor menor ou igual 0,05 = resultados foram significativos.
Verdadeiro ou falso:
p-valor precisa ser menor que o alfa para o resultado ser significativo.
Verdadeiro.
Se alfa 5%, p-valor precisa ser < 0,05.
Se alfa 1%, p-valor precisa ser < 0,01.
O que o p-valor representa e por que é importante que seja baixo?
p-valor representa a chance do desfecho ter ocorrido ao acaso, ou seja, sem nenhuma relação com os fatores de risco.
Quanto menor o p, mais significativa é a relação entre fator causal e o desfecho.
O que significa IC 95%?
Significa que se o teste for repetido 100 vezes, encontraremos a mesma associação em 95% das vezes.
Verdadeiro ou falso:
Quanto mais largo o intervalo de confiança, maior a amostra.
Falso.
Quanto mais estreito o intervalo de confiança, mais preciso e, portanto, maior a amostra.
Cite as medidas de frequência.
- Incidência
- Prevalência.
Em quais delineamentos podemos calcular a incidência?
- Coorte
- Ensaio clínico / comunitário.
Preciso ver a doença iniciando.
Cite as medidas de associação.
- Risco relativo
- Odds ratio
- Razão de prevalência
Risco relativo é usado em qual tipo de estudo? (2)
Coorte
Ensaio clínico
Odds ratio é usado em qual tipo de estudo?
Caso controle
É uma aproximação do RR.
Razão de prevalência é utilizada em qual tipo de estudo?
Transversal
Monte o quadro das medidas de associação.
.
O que significa RR, OR ou RP:
Igual 1
Maior que 1
Menor que 1
Igual 1 = sem associação
Maior que 1 = fator de risco
Menor que 1 = fator de proteção
Como definir se houve significância estatística?
p-valor < 0,05 (ou qualquer outro valor que a banca dê)
ou
IC não contendo o 1.
Medidas de efeito (especialmente úteis para o ensaio clínico):
RAR
Redução absoluta do risco: InE - IE
Medidas de efeito (especialmente úteis para o ensaio clínico):
RRR
Redução relativa do risco: 1 - RR.
Também chamada de eficácia
Medidas de efeito (especialmente úteis para o ensaio clínico):
NNT
Número necessário para tratar: 1/RAR.
Verdadeiro ou falso:
Quanto menor o NNT, mais eficaz é a intervenção.
Verdadeiro.
O NNT calcula quantos pacientes terão que ser submetidos à intervenção para que um único paciente seja “salvo” do desfecho.
Medidas úteis para o coorte:
Risco atribuível ao fator.
IE - InE.
Representa a parte do risco que seria “exclusivamente” atribuída ao fator de risco em questão.
Testes estatísticos.
Tipos de amostra.
Amostra pareada (dependente) X amostra não pareada.
Testes estatísticos.
3 passo-a-passo para a definição se quantitativa X qualitativa.
Quantos grupos estamos observando?
Há pareamento dos grupos?
Os dados são paramétricos?
Test t pareado.
Quantitativa X qualitativa
2 grupos
Pareamento
Dados paramétricos
Teste exato de Fisher.
Qualitativa X Qualitativa.
Amostra pequena (N < 5)
Teste de Qui quadrado.
Qualitativa X qualitativa
Amostra grande.
Para amostras quantitativas X quantitativas, qual testes utilizar?
Coeficiente de correlação de Pearson - distribuição normal.
Coeficiente de correlação de Spearman - distribuição assimétrica.
Avaliação de pelo menos 2 variáveis numéricas - regressão linear.
Por exemplo: peso do indivíduo em Kg X Consumo de alimento diário (em g).
Verdadeiro ou falso:
Tanto o risco relativo quanto o odds ratio medem a associação entre fator de risco e doença.
Verdadeiro.
Respectivamente da coorte e do caso controle.
Verdadeiro ou falso:
Risco relativo é a razão entre dois riscos.
Verdadeiro.
Risco relativo é a razão de um evento ocorrer em um grupo exposto em relação a outro não exposto.
Questão sobre estudo coorte que abordou a efetividade da aplicação em massa da Coronavac como prevenção da Covid-19 no Chile.
Análise estratificada: 63,7%
O que isso significa?
A incidência de Covid foi 63,7% menor nas pessoas vacinados do que nas não vacinadas.
Como cheguei a essa resultado? Coorte –> incidência.
Em qual estudo é possível calcular a eficácia?
No ensaio clínico - fase 3
Verdadeiro ou falso:
Não é possível chegar a conclusões sobre a associação entre bullying e transtorno alimentar.
Falso.
o OR é uma medida de associação e terá validade apenas se o intervalo de confiança for significativo.
Apenas o “bullying verbal não relacionado ao corpo” tem o IC englobando o 1.
Isso não invalida as demais associações.
Variável quantitativa ou numérica.
É possível contar e representar em números.
- possível calcular a média.
Qual o valor de t-crítico para IC 95%
1,96.
Para a unicamp!
IC = média +- (t-crítico x erro padrão)
Verdadeiro ou falso:
Quanto maior o tamanho da amostra, maior o intervalo de confiança.
Falso.
Quanto maior o tamanho da amostra, menor o intervalo de confiança (mais preciso).
Verdadeiro ou falso:
Quanto maior o tamanho da amostra, menor o erro padrão.
Verdadeiro.
O que significa p-valor < 0,05 (ou qualquer outro alfa pré-definido)?
- diferenças estatisticamente significativas entre os grupos estudados
- resultados são significativos e têm baixa probabilidade de terem ocorrido ao acaso
Verdadeiro ou falso:
OR é uma “aproximação” do RR.
Verdadeiro
Vínculo mental de RR e OD.
RR - estimar o risco | probabilidade
OD - associação | chance
Quais parâmetros olhar para ver se teve significância estatística? (2)
- p-valor < alfa (em geral, < 0,05)
- intervalo de confiança
Qual a magnitude da associação?
Valores entre < 1 = vai usar o complementar. Por exemplo: RR = 0,4 –> magnitude de 0,6.
Valores entre 1-2 = vai usar o valor depois da vírgula
Valores maiores 2 = vai reduzir 1. Por exemplo, RR = 3,4 –> magnitude de 2,4 ou 240%
Sobre o Forrest plot:
O que indica a linha horizontal curta?
Indica que a amostra do estudo foi grande - logo, é confiável.
Forrest plot.
O que significa o losângo?
A vertical é a média ponderada dos estudos (ou seja, o resultado final encontrado).
A horizontal é o intervalo de confiança. Logo, quanto mais curta, menor o IC, mais confiável.
O que significa o NNT?
Número necessário para tratar.
Quantos indivíduos precisam ser submetidos à intervenção para que um único paciente seja “salvo” do desfecho.
Cálculo do RAF.
Risco atribuível ao fator.
IE - InE.
Por exemplo: câncer de pulmão e tabagismo.
IE - 10% e INE - 8%.
Logo, RAF = 2%.
Isso significa que os tabagistas têm 2% a mais de ter câncer de pulmão do que os não expostos.
Qual o tipo de variável da faixa etária?
Variável qualitativa.
Por exemplo:
Se for 0-10 anos, 11-20 anos, etc - é ordinal.
Se for > 40 anos ou < 40 anos - é nominal.
O que é o hazard ratio?
Medida muito próxima ao risco relativo.
Estudo que comparou QI de crianças que foram ou não amamentadas com leite materno.
p-valor < 0,001.
Verdadeiro ou falso:
A probabilidade de que o tipo de leite ofertado afete o QI subsequente é de 99%.
Verdadeiro.
p valor < 0,001 significa que, sob as mesmas condições, os resultados observados se repetiriam 1 - 0,001 = 0,999, ou seja, 99,9% das vezes.
Verdadeiro ou falso:
NNT alto indica que o programa de rastreamento é pouco eficaz.
Falso.
É pegadinha!
Existem diversos critérios para a introdução de programas de rastreio:
- impacto significativo na saúde pública
- prevalência alta que justifique o rastreamento
- melhora no desfecho pelo tratamento durante o período sintomático.
etc.
Ensaio clínico sobre ivermectina e Covid-19.
Há resultados em que a ivermectina é fator de proteção; há resultados em que é fator de risco.
Contudo, nenhum deles teve significância estatística, ou seja, todos os IC englobam o 1.
O que isso significa?
Significa que não se observou a eficácia da ivermectina para nenhum dos desfechos.
Tinha a opção “não é possível concluir qualquer conclusão a partir dos resultados”. Isto está errado: é possível sim concluir que a ivermectina não teve impacto, positivo ou negativo, em nenhum dos desfechos estudados.
Quais medidas estimam probabilidade? E chance?
Probabilidade - risco relativo e razão de prevalência.
Chance - odds ratio.
Uma revisão sistemática de estudos que avaliaram a associação entre atividade física e incidência de depressão. Os resultados foram sumarizados em uma metanálise que encontrou OR = 0,83.
Qual a hipótese nula do estudo?
A hipótese nula (OR = 1) seria que não existe associação entre realizar atividade física e desenvolver depressão, seja essa associação de risco ou de proteção pela atividade física.
Como o OR < 1,0 logo hipótese nula descartada
Qual o estudo de maior peso?
O peso é representado pela bolinha preta (a média da intervenção).
Os 6 estudos têm o mesmo peso já que as bolinhas pretas apresentam o mesmo tamanho.
O que é e para que serve o teste de qui-quadrado?
HIAE
É um teste estatístico utilizado para diferenciar proporções.