Genética de Doenças Complexas, Genome-Wide Association Studies e Contributo dos estudos de associação Flashcards
Doenças Complexas
- Características complexas
- Vários genes envolvidos
- Comuns
- Efeito cumulativo de uma série de fatores genéticos e ambientais
- Heterogéneas entre pacientes
- Cancro, esquizofrenia, diabetes,…
Análise do grau de agregação familiar entre doenças complexas — Razão de Risco Familiar
- O grau de clustering numa família pode ser expresso pelo razão de risco familiar (risk ratio, λ)
> O risco de um parente de um indivíduo afetado em comparação com o risco da população em geral
λ(R) = (risco da doença em entre parentes de indivíduos afetados) / (risco da doença na população geral)
λ = 1 — significa que não há evidência que a doença se agrega mais na família do que seria esperado por acaso
λ > 1 — significa que há risco aumentado em relação à população em geral
λs = 3 — para uma doença específica, isso significa que os irmãos de indivíduos afetados têm três vezes mais probabilidade de desenvolver a doença comparados com a população em geral
Estudos de Coorte
Acompanham grupos de indivíduos ao longo do tempo.
- Prospetivos
-Retrospetivos
Estudos transversais (Cross-Sectional Studies)
Avaliam uma amostra num um único ponto no tempo para descrever a prevalência de uma condição ou a relação entre variáveis numa população
Estudo de Coorte Prospetivo
- Estudo longitudinal
- Iniciam-se antes do desenvolvimento do desfecho de interesse. Os participantes são acompanhados a partir do momento da exposição ao longo de um período de tempo para observar se e quando o desfecho ocorre
- Ex.: segue-se um grupo de indivíduos saudáveis, observa-se quem é exposto a um fator de risco (como fumar) e acompanha-se o desenvolvimento de doenças, como cancro, no futuro
Estudo de Coorte Prospectivo — Vantagens e Desvantagens
Vantagens:
- menor risco de viés de memória
- mais controle sobre a colheita de dados
Desvantagens:
- longa duração
- custos elevados
Estudo Epidemiológico do tipo Coorte Prospetivo
Primeiro:
- Identificamos indivíduos expostos ao fator que estamos interessados em estudar se está associado à doença (ex.: alelo de uma variante, fumo do tabaco ou obesidade)
- Indivíduos não expostos
Depois:
- Seguimo-los para ver se desenvolveram a doença ou não
Por fim:~
- Calculamos a incidência da doença nos que foram expostos e comparamo-la com a incidência nos que não foram expostos
Estudo de coorte retrospetivo
- Estudo histórico ou não concomitante
- Iniciam-se após o desenvolvimento do desfecho de interesse. Analisa-se dados existentes para examinar se houve exposição prévia aos fatores de risco
- Ex.: estuda-se indivíduos com uma doença e sem doença e investiga-se exposições diferentes entre eles
- Não significa que se esteja a usar dados recolhidos no passado
Estudo de coorte retrospetivo — Vantagens e Desvantagens
Vantagens:
- menos tempo
- custos mais baixos do que os estudos prospetivos
Desvantagens:
- maior risco de viés de memória
- menor controle sobre a qualidade dos dados
Estudo de Coorte retrospetivo do tipo caso-controlo
- Normalmente conduzidos antes de um estudo de coorte longitudinal ou de um estudo experimental para identificar a possível etiologia da doença
> tem custos menos elevados, pode ser conduzido num curto período de tempo - Pode-se investigar múltiplas exposições
- Preferível quando a doença é rara
- Casos devem ser homogéneos
- Os controlos devem vir da mesma população em risco de doença em que os casos surgiram
-
Matching: seleção de controlos semelhantes aos casos em características chave (ex.: idade, género e étnia)
> matching de indivíduos (pares semelhantes)
> matching de grupo (frequências semelhantes)
Estudo epidemiológico do tipo Coorte retrospetivo do tipo caso-controlo
Primeiro:
- Identificamos indivíduos com doença/fenótipo
- Indivíduos sem doença/fenótipo
Depois:
- Medimos quais foram ou não expostos (ex.: quais têm determinado alelo ou não)
Por fim:
- Calculamos e comparamos a frequência dos que foram expostos entre os dois grupos (ex.: frequência de determinado alelo na população de casos e de controlos)
Estudos genéticos populacionais
Pura associação estatística de uma região cromossómica ao fenótipo
1) Estudos de associação caso-controlo em genes candidatos
2) Estudos de Associação caso-controlo em todo o genoma (GWAS)
Fenótipo
- Doença (casos/controlos)
> raros
> comuns - Características quantificáveis
> fáceis de medir: altura, peso, …
> requerem testes: espessura da artéria coronária
> requerem experiências: expressão de genes
Estudos de associação em genes candidatos
- Testam a associação de variantes (SNPs, CNVs, etc….) num gene ou região específica do genoma com um fenótipo (doença ou característica quantificável)
- Verificam se determinado gene candidato (de acordo com a sua função conhecida, via celular envolvido, etc.) se encontra associado com um fenótipo
> muitos genes com função desconhecida
> escolher um gene candidato não é fácil/linear
Estudo de associação em todo o genoma (GWAS)
- Testam a associação estatística de uma grande proporção de variantes (SNPs, CNVs, etc,…) no genoma com um determinado fenótipo (doença ou característica quantificável)
- Encontram variantes associadas com um fenótipo sem informação prévia acerca de função génica ou mecanismo
GWAS — Vantagens
- Mais poder estatístico para detetar associação de variantes
- Maior resolução
- Não se restringe a genes candidatos
GWAS — Requisitos
- Catálogo de variantes genéticas humanas
- Bom método de genotipagem de baixo custo
- Número elevado de amostras informativas
- Design e análise estatísticos eficientes
Etapas dos GWAS
1) Recolha amostras e informação individual e clínica
2) Genotipagem (microarrays)
3) Controlo de qualidade
4) Análise estatística
5) Replicação dos resultados mais significativos numa amostra independente
GWAS — Recolha de amostras e informação individual e clínica
Aumento de efeito genético.
- Casos:
> fenótipo mais severo
> casos múltiplos em famílias
> idade baixa na manifestação
- Controlos:
> amostras de baixo risco vs população em geral
> mesma origem ancestral
> homogeneidade com os casos em idade, sexo, etc.
GWAS — Genotipagem (microarrays)
- Usualmente SNPs
- 100K SNPs (primeiro GWAS)
- 500K-1M variantes comuns distribuídos por todo genoma (tagSNPs)
- Ou se deteta diretamente a associação com a variante causal (manos provável)
- Ou se deteta indiretamente o efeito da variante causal (mais provável)
> deteta-se a associação da doença com uma variante que está em elevado LD com a variante causal
LD na população e blocos de haplótidos no genoma humanp
International HapMap Project
- ~8% do genoma humano é uma estrutura em mosaico composto por blocos de haplótidos, dentro dos quais existe pouca diversidade genética
- Ocorre devido ao desiquilíbrio de linkage (LD) no genoma: hereditariedade de variantes correlacionadas no no mesmo cromossoma
- haplotype tagging SNPs (tgSNPs) — SNPs representantes do haplótipo que estão em elevado LD entre si
- Permitiu melhorar a eficiência dos estudos genómicos populacionais através do estudo de htSNPs em vez de genotipagem do locus inteiro
GWAS — Análise estatística
- Testa-se individualmente e de modo independente a associação de cada SNP com a doença
Correlação para testes múltiplos: - ser seletivo nos resultados que declaramos ser significantes (correção para multiple testing)
Ajuste para co-variáveis: - Ajustamento para fatores que se sabem influenciar o fenótipo (ex.: género, idade, e outras variáveis clínicas)
- Análise de ancestralidade das amostras e em caso de haver estratificação populacionar excluir algumas amostras ou ajustar a análise
Medidas de associação — Quantificação do efeito
Risco Relativo (nos estudos de coorte)
- É o riso de ter a doença tendo um determinado fator (ex.: alelo num locus/variante) comparando com quem não é exposto a esse fator
- É definido como a razão entre a incidência da doença no grupo dos expostos e a incidência da doença no grupo dos não expostos ao fator de risco
- Um RR de 1.4 significa que os expostos têm 1.4x mais risco que os não expostos (40% mais)
- Não é influenciado pela incidência da doença na altura em que é feito o cálculo, pois reflete uma comparação relativa entre dois grupos (expostos e não expostos)
Medidas de associação — Quantificação do efeito nos GWAS
Nos estudos caso-controlo, não podemos calcular incidências porque não temos população em risco no início do estudo
Odds Ratio (effect size):
- OR é rácio entre a “odds” de exposição no grupo dos casos e a “odds” de exposição no grupo dos controlos
- Não tem em conta a incidência da doença e reflete a relação entre a presença da variante e a doença
- Nos estudos genéticos, o OR é muitas vezes expresso por alelo, refletindo o efeito de uma cópia da variante de risco
- É importante calcular-se o intervalo de confiança para cada OR:
> Um intervalo de confiança que inclua o 1 significa que a associação encontrada entre a exposição e o outcome (doença) pode ter sido encontrada por chance e que não é e estatisticamente significativa
GWS — Replicação
- As associações iniciais encontradas nos GWAS precisam de ser confirmadas
- Os SNPs candidatos nas regiões com associação estatística são genotipados numa amostra de replicação independente
- Confiança extra é obtida com:
> p-values mais baixos
> replicação num estudo independente numa população
Procedimento para encontrar a variante causa num GWAS
A sequenciação do bloco de haplótipos onde se encontra a variante associada permitirá:
- Encontrar CNVs e variantes com freq < 5%
Genomewide association study identifies a SNP that is associated with the disease → Identify the haplotype block involved → Sequence the block in a panel of cases and controls to identify every variant → Test association of each variant with the disease, using logistic regression to disentangle effects of linkage disequilibrium between SNPs → Identify the factor(s) giving the strongest association(s) and perform functional assays
Contributo dos estudos de associação em genes candidatos para doenças complexas
- Poucos estudos de associação em genes candidatos foram replicados/confirmados em estudos seguintes
- A maioria das variantes com OR elevados foram identificadas antes dos GWASs (ex.: apoE4 na Doença do Alzheimer, alelos comuns no NOD2 na doença na doença de Crohn’s e especielmente alelos HLA com doenças autoimunes)
Exemplo GWAS — Estudo do WTC em 2007
- 7 doenças comuns
- 2000 casos bem caracterizados para cada doença
- 3000 controlos comuns
- Genotipagem 500000 SNPs
> identificação de 25 sinais independentes de associação a uma das doenças (p<5 x 10-7)- 13 já identificados anteriormente e os restantes novos. A maioria dos novos confirmados posteriormente
- Identificação de 25 sinais independentes de associação a uma das doenças
- OR (risco para heterozigóticos comparado com risco para homozigóticos sem alelo de risco:
> 1.09-5.49 (associação já conhecidas de alelos HLA com doença auto-imunes)
> 1.09-2.08
Conclusão: Estas doenças complexas não têm fatores de suscetibilidade individuais fortes
Frequências e magnitudes do efeito/penetrância de alelos patogénicos
Rare alleles causing Mendelian disease:
- allele frequency: very rare
- effect size: high
Low-frequency variantes with intermediate effect
Common variants implicated in common disease by GWAS:
- allele frequency: common
- effect size: low
Rare variants of smal effect — very hard to identify by genetic means
Cancro da mama — Conhecimento atual dos fatores genéticos
- Antes de 2007: estudos de linkage e em genes candidatos ~25% heritabilidade
- Primeiros GWASs: 18 new susceptibility hits (2007-2011) ~8% heritabilidade
- GWAS subsequentes em amostras maiores: 94 new loci (2007-2015) ~14% heritabilidade
Neste momento permanecem por identificar ~50% dos fatores genéticos para o cancro da mama
Common disease — Common variant hypothesis
- Frequencies of susceptibility alleles: high
- Effect sizes of susceptibility alleles: small
- Locus heterogeneity (number of suscetibility loci for a given disease): high
- Allelic heterogeneity (number of different susceptibility alleles at a locus): low
- Origin of susceptibility alleles: ancient common ancestor
- Technology to detect susceptibility factors: association studies
Mutation — selection hypothesis
- Frequencies of susceptibility alleles: low
- Effect sizes of susceptibility alleles: moderate
- Locus heterogeneity (number of suscetibility loci for a given disease): could be low
- Allelic heterogeneity (number of different susceptibility alleles at a locus): high
- Origin of susceptibility alleles: relatively recent mutations
- Technology to detect susceptibility factors: resequencing
História dos GWAS e expetativas
- Primeiro GWAS realizado em 2002: enfarte do miocárdio
- Primeiro GWAS para cancro da mama: 2007
- Expetativa dos GWASs: encontrar a base genética para a hereditariedade
- Milhares de estudos, centenas de milhares de indivíduos, milhares de milhões de SNPs genotipados, milhões investidos
Conhecimento adquirido pelos GWAS
- GWAS provaram que a maioria das doenças comuns são poligénicas
- Identificaram novos genes e mecanismos causadores de doença
- Levaram a avanços nos cuidados clínicos (ex.: identificação de novos alvos possíveis para drogas, de biomarcadores para doenças)
Conhecimento adquirido pelos GWAS — Vias biológicas envolvidas
Papel da imunidade adaptativa na Esclerose múltipla:
- Os GWAS confirmaram um papel principal da imunidade adaptativa (com poucos hits relacionados com vias neuronais)
- GWAS mostraram variantes de risco comuns entre esclerose múltipla e a doenças auto-imunes
Doença de Crohn’s:
- Apontaram (pela 1º vez) para a importância da autofagia
- Salientaram a importância de vias do sistema imune inato
Mecanismos funcionais
Conhecimento adquirido pelos GWAS — Variantes associadas
- Maioritariamente genes e regiões não suspeitas anteriormente
- Poucas (e das mais fortes) em regiões codificantes
- Maioria das associações estão em elementos reguladores
- Algumas estão em desertos génicos
Limitações dos GWAS
1) As descobertas dos GWAS não explicam toda a heritabilidade (normalmente < 10%)
- cancro da mama contribuíram para identificar 14%
- menos em doenças de foro psiquiátrico (ex.: esquizofrenia)
2) As variantes identificadas conferem um risco individual muito baixo (allelic effect size estimates < 1.3)
- é necessário amostras muito grandes para se detetar o efeito de variantes raras e de risco baixo
3) A variante associada não é necessáriamente a variante causal/responsável pela doença
- LD com a variante causal
4) Não trazem benefício direto aos pacientes
Estatística → Biologia → Medicina
O sucesso dos GWAS depende…?
1) Do tamanho da amostra analisado
2) Da magnitude do efeito causado pela variante causal (desconhecido à partida)
3) Da frequência da variante causal
4) Do LD entre a variante causal e a variante genotipada