Bioestatística aplicada à análise de estudos epidemiológicos Flashcards
A bioestatística trabalha com variáveis. Como é a classificação conforme natureza matemática?
1- Quantitativas (ou numéricas/contínua):
a) Contínuas: aceita números fracionários. Ex.: temperatura, altura, peso, idade, hemoglobina, PA.
b) Discretas: não aceitam números fracionários. Ex.: número de filhos (não tem 1,5 filhos, tem 1 ou 2 ou 3, etc), número de cigarros fumados, FC, FR, atendimentos ambulatórios
- > Para lembrar: quantitativo = descrita em tendência central (média, mediana, moda) e medida de dispersão (desvio-padrão). Ex.: média de idade.
2) Qualitativas (ou categóricas):
a) Ordinais: existe ordenação entre as categorias. Ex.: classe social, estadiamento do câncer, grau de escolaridade.
b) Nominais: não existe ordenação. Ex.: sexo, etnia, tipo sanguíneo, cor dos olhos, doente/não doente.
- > Para lembrar: qualitativa = descrita em porcentagem.
A bioestatística trabalha com variáveis. Como é a classificação conforme função no teste estatístico?
1- Variável independente ou fator em estudo: é o que causa o efeito.
2- Variável dependente ou desfecho: é a consequência do fator em estudo.
Quais são as medidas descritivas para as variáveis qualitativas? Cite e comente.
Medidas de ocorrência:
- Frequência absoluta: contagem de ocorrências de uma das categorias.
- Frequência relativa: proporção de elementos que pertencem a uma categoria (percentual, é possível comparar dados).
Quais são as medidas descritivas para as variáveis quantitativas? Apenas cite.
Medidas de tendência central e de dispersão.
Explique: medidas de tendência central.
Mostram quais são os valores que estão no centro da amostra. As mais usadas são:
- Média: É a soma dos valores da amostra dividida pelo número de observações.
- Mediana: medida que está no centro da amostra (é o valor que separa metade maior da menor, ñ sofre influência de valores extremos).
- Moda: é o valor que mais aparece na amostra.
Na amostra: 5 4 2 6 4 5 7 2 4 3. Dê as medidas de tendência central.
- Média: (5 + 4 + 2 + 6 + 4 + 5 + 7 + 2 + 4 + 3) ÷ 10 = 42/10 = 4,2.
- Mediana: 2 2 3 4 4 4 5 5 6 7 -> (4+4) ÷ 2 = 8/2 = 4.
- Moda: 4.
Com base na tendência central, como pode ser a distribuição da variável? Explique.
1- Distribuição simétrica (normal -> gráfico em forma de sino): a média, a mediana e a moda estão centradas e são iguais. Usamos a média.
2- Distribuição assimétrica (anormal): a média está desviada. Nesses casos temos que usar a mediana (que será a medida mais central do gráfico).
FOTOS: gráficos do intensivão medcurso; resposta do prof medcel.
Explique: medidas de dispersão.
“É o quanto os dados se afastam da média. Ex: se a média de altura foi 1,70, quantas pessoas se afastam dessa altura?”
- Variância: soma do quadrado dos desvios dividida pelo nº observações. -> Σ(x-x ̅)²/n
- Desvio-padrão: é a raiz quadrada da variância. Nos dá o dado do quanto as pessoas se afastam da média na unidade da variável que está sendo medida. -> √Σ (x-x ̅)²/n
Obs: x = variável da pessoa (ex: altura da pessoa); x ̅ = variável média (ex.: altura média).
Explique o gráfico (foto) da distribuição normal (simétrica) e comente sobre a % da amostra de acordo com desvio-padrão.
- Quando somamos 1 desvio-padrão acima da média e 1 desvio-padrão abaixo da média nós temos cerca de 70% da amostra.
- Quando temos 2 desvio-padrão acima da média e 2 desvio-padrão abaixo da média nós temos cerca de 95% da amostra.
Exemplo (complete): se a média de altura é de 1,70m e temos 1 desvio-padrão (1 DP) de 10 cm, se colocarmos 2 DP pra cima e 2 DP baixo, teremos que __% da população tem altura entre ___ e ___?
Teremos que 95% da população tem altura entre 1,50m e 1,90m, sendo a média 1,70m.
Para que usamos medidas de associação?
Para responder se existe uma associação entre uma exposição e um desfecho.
CITE as medidas de associação. (8)
1- Risco absoluto. 2- Risco relativo (RR). 3- Risco atribuível (RA) ou Redução do risco absoluto (RRA) ou Risco atribuível ao fator (RAF). 4- NNT (Nº Necessário ao Tratamento). 5- Odds Ratio (OR). 6- Razão de prevalências (RP). 7- Risco atribuível na população (RAP%). 8- Redução do risco relativo (RRR).
*FOTO: Memorize: tem as fórmulas.
Qual a “frequência” do estudo de Coorte? Quais medidas de associação podemos calcular nesse estudo?
- Frequência: incidência.
- Medidas de associação: RR, RA, RAP.
*Iremos comparar os riscos de duas populações, que diferem quanto à exposição a um fator, através das medidas de associação e de impacto.
Qual a “frequência” dos ensaios clínicos? Quais medidas de associação podemos calcular nesse estudo?
- Frequência: incidência.
- Medidas de associação: RR, RA, RRR, NNT.
Qual a “frequência” dos estudos de caso-controle? Quais medidas de associação podemos calcular nesse estudo?
- Frequência: prevalência.
- Medidas de associação: OR (estimativa do RR) e RAP (é uma conta diferente do de Coorte).
*Normalmente, as doenças estudadas através de casos e controles são raras.
Qual a “frequência” dos estudos transversais? Quais medidas de associação podemos calcular nesse estudo?
- Frequência: prevalência.
- Medidas de associação: RP.
Risco absoluto - definição e fórmula.
- É a incidência.
- Fórmula:
1) R.A nos expostos (IE) = A/A+B.
2) R.A nos não expostos (I ÑE) = C/C+D.
*Tabela 2x2 = A, B, C, D.
Risco relativo - pra que serve? Fórmula?
- Indicar a força da associação entre o fator de exposição e a doença.
- Fórmula (relação entre riscos absolutos): R.R. = I E/I ÑE.
Risco relativo - Como é sua interpretação?
- RR < 1: fator protetor. Existirá a possibilidade de o fator ser de proteção, já que a exposição ao mesmo diminui o risco de surgimento do efeito.
- RR = 1: sem efeito. Estudo não apresentou relação de associação entre fator e efeito.
- RR > 1: fator de risco. Existirá a possibilidade de o fator ser de risco, já que a exposição ao mesmo aumentou o risco de surgimento do efeito.
Obs.: devemos confirmar RR com o cálculo de IC.
Risco atribuível - definição e fórmula
- É o quanto do risco é atribuível à intervenção ou exposição (ver qual o risco adicional da exposição, ou seja, saber quanto eu tenho de risco adicional p/ tal desfecho, por estar exposto aquele fator).
- Fórmula (diferença entre riscos absolutos): RRA = IE - I ÑE
NNT - pra que serve? Fórmula?
- Com o NNT teremos uma ideia melhor do quanto a medida é eficaz.
- Fórmula:
NNT = 100/RRA (ou faz regra de 3).
Ex.: se RRA = 5%. Qual meu NNT?
R: 100/5 = 20 OU regra de 3 = 100 — 5 | X — 1 -> X = 100/5 = 20, ou seja, preciso tratar 20 pacientes para que 1 pessoa morra a menos (prevenir 1 morte).
Qual valor de NNT refletiria uma intervenção benéfica?
Um NNT próximo a 1, mas raramente se encontra um valor assim.
Odds Ratio - é o que? Fórmula?
É um estimador de associação (estimativa do RR). OR é uma razão de chance, e não probabilidade.
- Fórmula:
(A x D)/(B x C)
Odds Ratio - Como é sua interpretação?
A MESMA que a do RR:
- OR = 1: estudo não apresentou relação de associação entre fator e efeito.
- OR > 1: existirá a possibilidade de o fator ser de RISCO, já que no grupo dos casos a presença do fator teve maior proporção.
- OR < 1: existirá a possibilidade de o fator ser de PROTEÇÃO, já que no grupo dos controles a presença do fator teve maior proporção.
Obs.: também devemos confirmar OR com o cálculo de IC.
Razão de prevalências - fórmula?
RP = P E/P ÑE.
Obs.: também devemos confirmar RP com o cálculo de IC.
*RP é idêntica ao risco relativo, mas a interpretação tem que levar em consideração a prevalência.
Risco relativo - Para CONFIRMAR se o fator será aceito e generalizado como de RISCO ou PROTEÇÃO, precisamos do apoio da estatística, através de qual cálculo?
Do Intervalo de Confiança, estimativa que dará os valores possíveis verdadeiros.
Intervalo de Confiança - o que é?
É uma medida de precisão do risco relativo.
- Em outras palavras: se eu reproduzir um estudo 100 vezes, em 95 (IC = 95%) vezes o valor verdadeiro estará em um determinado intervalo. Se este intervalo não apresentar o valor “1” (que me informaria não existir associação entre entre fator e efeito) poderei fazer a INFERÊNCIA e usar o mesmo resultado no meu cotidiano.
Intervalo de Confiança - Como é feita sua interpretação?
1- Para um IC confirmar o RR como sendo de RISCO (ou seja, meu RR é > 1): o IC não deverá ter a unidade 1 e o seu limite inferior deverá ser > 1.
*No gráfico: IC 95% está TOTALMENTE à DIREITA do RR = 1. Valor P < 0,05.
2- Para um IC confirmar o RR como sendo de PROTEÇÃO (ou seja, tenho um RR < 1): o IC não deverá ter a unidade 1 e o seu limite superior deverá ser < 1.
*No gráfico: IC 95% está TOTALMENTE à ESQUERDA do RR = 1. Valor P < 0,05.
3- Já quando meu I.C. cruzar o valor 1, isso significa que algumas vezes encontrarei o RR < 1 (fator de proteção) e alguma vezes encontrarei o RR > 1 (fator de risco), além do RR = 1 (demonstrando não ter associação), indicando que minha estimativa é IMPRECISA, a probabilidade de erro amostral é grande e eu não posso acreditar nos dados, não há significância estatística. Logo, não se rejeita a hipótese de nulidade, o que indica que não há associação entre exposição e desfecho.
*No gráfico: IC 95% CRUZA o RR = 1. Valor P > 0,05.
Intervalo de Confiança - o intervalo mais confiável é aquele amplo ou estreito? Pq?
Quanto menor o intervalo de confiança, mais confiável é o estudo! Pois quanto mais ESTREITO o intervalo, mais confiança/precisão tenho e provavelmente a pesquisa que gerou este intervalo estreito teve origem em uma amostra bem grande.
Dos estudos abaixo, cite o mais preciso e o menos confiável e justifique.
- Estudo 1: RR = 10 (IC 95% 1,1 - 22,5).
- Estudo 2: RR = 10 (IC 95% 9,3 – 10,8).
- Estudo 3: RR = 10 (IC 95% 0,6 – 42,0).
- O estudo mais preciso é o estudo 2, pois o IC teve pouca variação.
- O estudo menos confiável é o estudo 3, pois o IC me indica que ora o fator foi protetor (RR pode ser 0,6) , ora não teve associação (RR pode ser 1) e ora o fator foi de risco (RR pode ser maior que 1), logo, não da pra confiar no estudo.
Risco Atribuível na População (RAP%) - definição e fórmulas
- É uma estimativa da “quantidade de doença” que é atribuível unicamente à exposição.
- Para estudos de coorte: (RAP%)= (I N-I NE)/(I N)
- Para estudos caso-controle: RAP%= (F (OR-1))/({F (OR-1) +1}) X 100
*IN = incidência global. | F = proporção de ocorrência do fator na população total (ou seja, a proporção da população exposta ao fator).
COMPLETE:
Medida de significância estatística: Para que uma associação seja válida precisamos nos assegurar de que as seguintes condições foram afastadas: (1), (2) e (3). Assim respondemos à pergunta: “Qual é a chance de que a associação entre uma exposição e um desfecho se deva ao acaso?” -
(1) acaso (erro aleatório), (2) vieses (erro sistemático) e (3) confundimento.
- Acaso = oposto de precisão.
- Viés = oposto de validade.
Quais medidas usamos para mensurar, de forma sistemática e padronizada, qual o grau de certeza que determinado achado corresponda à realidade (ou seja, determinar se a probabilidade de acaso (erro aleatório) é alta/baixa)?
Valor de P e do Intervalo de Confiança (IC).
Valor P - o que é como interpretar?
O valor P nos diz se um dado é preciso ou não, se a probabilidade de acaso é alta ou baixa.
- Baixo (< 0,05 ou 5%): a probabilidade de acaso é baixa. Posso confiar nos resultados. (Medida é precisa, não é erro amostral). Posso rejeitar H0 e substituir por Ha.
- Alto (> 0,05 ou 5%): a probabilidade de acaso é alta. Não posso confiar nos resultados. (Medida não é precisa, pode ser erro amostral). Não posso substituir H0 por Ha.
Medida de significância estatística: Nos testes estatísticos, o uso da análise estatística de um estudo pode encontrar 2 explicações para os resultados encontrados em um estudo. Quais são elas? Comente.
- Motivo: é a causa da diferença entre os grupos.
- Acaso: é a ausência de uma causa para explicar a diferença, sendo esta devido à causalidade ou ao azar. Basicamente se a probabilidade do acaso for > 5% = o acaso é o responsável pela diferença.
Medida de significância estatística: Para diferenciar os resultados encontrados em um estudo devido ao ACASO ou MOTIVO, devemos iniciar formulando hipóteses. Quais são essas hipóteses e o que representam?
- Hipótese de nulidade (H0): hipótese de que todos são iguais, não há diferença entre os grupos e a razão de riscos/chances é igual a 1.
- Hipótese alternativa (Ha): hipótese de que há diferença,
de que os grupos são diferentes, associação ou aumento/diminuição do risco.
O uso da estatística é como verificamos se o que acontece na amostra é suficiente para rejeitar uma hipótese de nulidade (H0) e substituí-la por uma hipótese alternativa (Ha).
O que é nível de significância de um teste?
É a probabilidade máxima de se rejeitar H0.
Medida de significância estatística: Existe diversos testes estatísticos que utiliza a estratégia do teste de hipótese, cite-os de acordo com suas divisões.
*Foto: MAPA MENTAL.
“Resumindo”:
- Teste t = comparação de 1 variável numérica e 1 categórica. Ex.: comparar a PA (numérica) entre diabético e não diabéticos (categórica).
- —- • Variação: ANOVA = quando a categoria tiver mais de 2 níveis. Ex.: comparar a PA entre etnias.
- Qui-quadrado = comparação de 2 variáveis categóricas. Ex.: sexo x Q.I (alto ou baixo); etnia x escolaridade; proporção de morte entre os sexos.
- —- • Variação: teste de Fisher = para amostras pequenas (< 5).
- Correlação: entre 2 variáveis numéricas. Ex.: peso x PA = usa o coeficiente de Pearson.
- —- • Regressão: expressão matemática da correlação.
EXPLICITANDO:
1- Se for comparar grupos: tenho que saber se o desfecho é contínuo ou categórico.
A) Desfecho contínuo: temos que ver se a distribuição é normal (teste t de student = compara médias de 2 grupos; ANOVA = compara médias de 3 ou + grupos; teste pareado) ou distribuição não normal (que usa testes equivalentes não-paramétricos = tem o equivalente do teste t, o equivalente do ANOVA e o equivalente do teste pareado).
B) Desfecho categórico: usa o Qui-quadrado = compara proporções em 2 ou mais grupos (ex: sexo, dor do cabelo); teste de Fischer = compara proporções em 2 ou mais grupos quando alguma das variáveis for < 5.
2- Se for correlacionar uma variável a um desfecho: exemplo -> saber se um remédio usado irá alterar mortalidade E IMC, etc. Tenho que saber se o desfecho é contínuo ou categórico.
A) Desfecho contínuo: temos que ver se a distribuição é normal (correlação de Pearson, regressão linear) ou distribuição não normal (correlação de Spearman).
B) Desfecho categórico: regressão logística = é uma função matemática.
Vieses ou Bias ou Vícios ou Erros sistemáticos: definição?
Qualquer erro sistemático no desenho, condução ou análise de um estudo que resulte em uma estimativa equivocada do efeito de exposição risco da doença.
Vieses ou Bias ou Vícios ou Erros sistemáticos: há 3 tipos. Cite-os.
- Vícios de seleção.
- Vícios de aferição.
- Confusão.
*Os 3 são diferentes devido às próprias consequências e ao momento do estudo que ocorrem.
Vieses ou Bias ou Vícios ou Erros sistemáticos: Viés de seleção - onde ocorre o erro?
Erro ocorre na seleção dos pacientes, comum nos estudos caso-controle.
Vieses ou Bias ou Vícios ou Erros sistemáticos: Viés de seleção - porque ocorrem?
Podem ocorrer por:
- Randomização inadequada: grupos muito diferentes que não podem ser comparados.
- Controles muito saudáveis (ex.: trabalhador saudável) ou muito doentes: que não representam o grupo de caso no passado.
- Auto-seleção: quando selecionam pessoas que se voluntariam.
- Perda de seguimento.
Vieses ou Bias ou Vícios ou Erros sistemáticos: Viés de de Berkson ou Bersoniano - ocorre em que estudo e pq?
É um viés de seleção que ocorre nos estudos de caso-controle, quando os pacientes do grupo controle apresentam uma frequência de exposição maior do que a população que supostamente seria a origem dos casos, podendo levar a conclusão equivocada de que a exposição tem um menor tamanho de efeito (ou um tamanho de efeito negativo).
Vieses ou Bias ou Vícios ou Erros sistemáticos: Viés de seleção - principal estratégia para seu controle? Cite outras tb.
Randomização adequada.
- É o que mais garante que os grupos serão comparáveis.
Outras: análise (ajuste) multivariável; restrição, pareamento, estratificação, ajuste simples, melhor caso/pior caso.
Vieses ou Bias ou Vícios ou Erros sistemáticos: Viés de aferição - onde ocorre o erro?
Ocorre erro na aferição dos fatores em estudo e do desfecho.
- Viés de aferição é quando os grupos são avaliados de maneira diferente.
Vieses ou Bias ou Vícios ou Erros sistemáticos: Viés de aferição - principal estratégia para seu controle?
Mascaramento dos avaliadores; padronização dos instrumentos.
Vieses ou Bias ou Vícios ou Erros sistemáticos: Viés de aferição - cite outras estratégias para seu controle.
Padronização dos métodos, desfechos duros (desfechos que de fato aconteceram, como morte, cura -> não dá para o médico dizer que paciente não morreu porque não é o que ele acredita, por ex), treinamento e certificação dos avaliadores, calibração dos instrumentos.
Vieses ou Bias ou Vícios ou Erros sistemáticos: Viés de confusão - onde ocorre o erro?
Ocorre erro na avaliação da associação entre exposição e desfecho (quando vamos avaliar os resultados do estudo).
Vieses ou Bias ou Vícios ou Erros sistemáticos: Viés de confusão - ocorre de que maneira e em que etapa?
Ocorre quando uma 3ª variável (variável confundidora, diferente da variável principal do estudo) atrapalha a avaliação da associação entre exposição e desfecho.
Vieses ou Bias ou Vícios ou Erros sistemáticos: Viés de confusão - principal estratégia para seu controle?
- Antes do início do estudo: randomização.
- Depois início do estudo: controle estatístico através da análise multivariada (ex: regressão linear múltipla ou regressão logística).
Complete:
“Quando uma variável na análise não ajustada é significativa, mas depois do ajuste ela deixa de ser significativa, isso significa que ela era uma variável de ______, e é a variável ajustada/não ajustada? que conta para a análise final.
“Quando uma variável na análise não ajustada é significativa, mas depois do ajuste ela deixa de ser significativa, isso significa que ela era uma variável de CONFUSÃO, e é a variável AJUSTADA que conta para a análise final.
Leia o trecho abaixo e diga qual o viés presente.
“Um pesquisador verifica que existe maior frequência de doentes de câncer de pulmão entre indivíduos que fumam cigarro e tomam café. Sabemos que o hábito de fumar está na cadeia de causalidade do câncer de pulmão, mas o de tomar café pode ter surgido como uma variável de ______, não estando associado ao câncer, e sim ao hábito de fumar.”
Viés de confusão. O cigarro no estudo é uma variável de confusão.
Qual a finalidade do:
- Ajuste simples?
- Ajuste multivariável?
- Ajuste simples: controle o efeito de uma variável.
- Ajuste multivariável: controla o efeito de muitas variáveis, serve para determinar o efeito independente de cada uma delas.
Complete:
1) Ausência de erro sistemático (____) = estudo __/__.
2) Ausência de erro aleatório (____) = estudo __/__.
1) Ausência de erros sistemático (VIÉS) = estudo válido/acurado.
2) Ausência de erro aleatório (ACASO) = estudo preciso/confiável.
Defina:
- Eficácia.
- Efetividade.
- Eficiência.
- Eficácia: tratamento em condições ideais. Validade interna.
- Efetividade: tratamento em condições reais. Generalização… Validade externa. “Intention to treat”.
- Eficiência: relação custo-benefício.