Unidade 4 - Genómica Populacional e GWAS Flashcards
O que significa GWAS?
Genome-Wide Association Studies
Estudos de associação de genomas completos
O que é a genómica populacional?
É o estudo dos polimorfismos e da deriva genética de uma população.
Averigua padrões no genoma entre e dentro de populações, para fazer inferências sobre a evolução e o genoma.
Estudo das diferenças genéticas naturais entre organismos.
O que são polimorfismos?
Diferenças genéticas comuns entre organismos da mesma espécie.
Marcadores polimórficos não têm todos a mesma taxa de mutação.
O que é a deriva genética?
Acumulação de polimorfismos ao longo de gerações.
Esta acumulação não ocorre ao mesmo nível para todos.
O que são Indels?
Polimorfismos de inserções ou deleções.
São raros nos exões e a maioria é menor que 10 bps.
Podem ir de 1 a 5 kb - ex.: elementos transponíveis
O que significa a sigla CNV?
Copy Number Variations
O que são CNVs?
- Copy Number Variations
- Variação no nº de uma sequência específica de DNA entre indivíduos da mesma população
- Tipo de polimorfismo de larga escala (200 a 300 kb)
Que processos podem resultar em CNVs?
- Deleções
- Duplicações
- Translocações durante a meiose
Dá um exemplo de doença genética causada por CNVs.
Alpha-Thalassemia:
- doença genética humana
- resulta de CNVs onde duplicações de α-globina podem causar um fenótipo severo em portadores de Beta-Thalassemia devido ao desequilíbrio da cadeia de globina
O que são STRs?
Short Tandem repeats
- Sequências curtas de DNA repetitivas, altamente polimórficas
Qual é o outro nome para STRs?
Microssatélites
Que tipo de sequências flanqueiam os STRs?
Sequências altamente conservadas
Como se representam os STRs?
Exemplo: (5’-CAT-3’)n
5’-CATCATCATCAT…CATCAT-3’
3’-GTAGTAGTAGTA…GTAGTA-5’
O que são “nucleotide motifs”?
São pequenas sequências repetitivas dentro do genoma que servem como pontos de reconhecimento
Para que servem os “nucleotide motifs”?
Úteis como marcadores genómicos em estudos forenses.
O que acontece quando o comprimento dos repeats é maior/aumenta?
A sua frequência diminui, porque repetições mais longas são mais suscetíveis a acumular mutações.
Qual é a utilidade de Sequenciamento em paralelo massico (NGS) em STRs?
- Permite detetar variações nos nucleótidos da sequência nos marcadores alvo, incluindo variantes em regiões de reppetição STR e sequências flanqueadoras.
- Discrimina alelos que seriam indistinguíveis em eletroforese capilar por separação de tamanho
- Vantajoso para a interpretação de perfis misturados complexos
- Indica diferenças nos alelos
O que significa a sigla “SNP”?
Single-Nucleotide Polymorphism
Qual o tipo de variação mais comum no genoma humano?
SNPs
- 96% de toda a variação polimórfica
O que é um SNP?
É a diferença de um par de nucleótidos num sítio específico do DNA, entre indivíduos de uma população.
Onde se encontram os SNPs?
- Regiões codificantes
- Regiões não-codificantes
- Regiões entre genes (intergénicas)
Que consequências tem a presença de SNPs em regiões não-codificantes?
Podem afetar:
- Splicing de genes
- Ligação de fatores de transcrição
- Degradação de RNA mensageiro
- Degradação da sequência de RNA não-codificante
- Alteram a quantidade de proteínas produzidas
Que consequências tem a presença de SNPs em regiões codificantes?
- Afetam a expressão genética
- Alteram a sequência de aminoácidos
Que consequências tem a presença de SNPs em regiões intergénicas?
Não têm efeito na produção de proteínas, nem na sua função.
Que utilidade têm os polimorfismos de DNA?
- Estimar variações genéticas em populações diversas
- Identificar fatores de risco
- Identificar indivíduos
- Associar a características desejáveis em plantas ou animais
- Monitorizar diversidade genética
- Perceber padrões de migração das populações humanas, a sua evolução e a sua história
Como se calcula uma frequência genómica?
(nº de indivíduos com o genótipo) / (nº de indivíduos analisados)
Como se calcula uma frequência alélica?
(nº total de alelos referentes à característica) / (nº total de alelos testados)
Quantos alelos tem cada indivíduo?
2
Em quanto resulta a soma da frequência alélica de cada um dos alelos?
1
O que defende o princípio de Hardy-Weinberg (HW)?
As frequências alélica e genómica de uma população mantêm-se constantes ao longo das gerações quando há ausência de outras influências evolucionárias.
Que fenómenos evolucionários podem afetar o equilíbrio de HW?
- Deriva genética
- Escolha de parceiro (acasalamento seletivo)
- Seleção natural
- Mutações
- Fluxo genético
- Deriva meiótica
- Boleia genética
- Efeito fundador
- Endogamia
Para que servem os testes de frequências genéticas de HW hoje em dia?
Para testar a estratificação populacional (diferenças alélicas derivadas de ancestralidade) e outras formas de acasalamento não-aleatório.
Qual é a equação do equilíbrio de HW?
(p+q)^2 = p^2 + 2pq + q^2 = 1
p e q são frequências alélicas.
- p^2 -> AA; q^2 -> aa (homozigóticos)
- 2pq -> Aa (heterozigóticos)
Que 7 circunstâncias devem ser verificadas para poder assumir o equilíbrio de Hardy-Weinberg?
- Organismos são diploides
- Apenas ocorre reprodução sexual
- As gerações não se sobrepõem
- Acasalamento é aleatório
- População é infinitamente grande
- Frequências alélicas são iguais em ambos os sexos
- Não há fenómenos evolucionários a influenciar o equilíbrio
O que significam as siglas HWE e HWP?
HWE - Equilíbrio de Hardy-Weinberg
HWP - Princípio de Hardy-Weinberg
Como se testam os desvios significativos no HWP?
Pearson’s chi-squared test - sistemas normais
Fisher’s exact test - sistemas com grande número de alelos
Quando se usa o teste “Fisher’s exact test”?
Quando os sistemas têm um número maior de alelos
Porque é que se usa o Fisher’s exact test quando há um grande nº de alelos?
Porque muitos alelos podem resultar em muitos genótipos vazios e contagens genotípicas baixas (não há indivíduos suficientes na amostra para representar todos os genótipos)
Como funciona o teste Pearson’s chi-squared?
Se o valor do qui-quadrado calculado for maior que o valor crítico da distribuição qui-quadrado para um determinado nível de significância (ex: 5%), que neste caso é um valor de 3,84 para 5% de significância com 1 grau de confiança, rejeitamos a hipótese nula e concluímos que há evidência de uma associação estatisticamente significativa entre as variáveis.
Ou seja,
Se X^2 < 3,84, então não se rejeita a hipótese nula.
Hipótese nula: a população está em equilíbrio de H-W
O que é o efeito gargalo/bottleneck (engarrafamento populacional)?
É quando uma população diminui para um tamanho significativamente menor, num período de tempo muito curto.
Num evento de efeito gargalo, a sobrevivência de alelos é completamente ao acaso e não é influenciada por seleção.
Dá um exemplo de um efeito gargalo numa população.
Caça excessiva causou uma redução drástica na população de elefante marinho do norte.
O que é o efeito fundador?
É quando um pequeno grupo da população se separa da original e forma uma nova população.
O novo conjunto de alelos não irá representar adequandamente a população original.
Os fundadores afetam a genética populacional futura.
Dá um exemplo de um efeito fundador numa população.
Distribuições de haplogrupos mitocondriais dos judeus sefarditas portugueses.
- A comunidade de Belmonte tem baixa diversidade com apenas duas linhagens e todas as amostras dentro de cada haplogrupo apresentam o mesmo haplótipo.
- A distribuição destes grupos é desigual considerando que um deles tem uma frequência de 93.3%
O que é a deriva genética?
É uma mudança aleatória na frequência alélica ao longo do tempo, causada pelos efeitos do acaso na reprodução e segregação de alelos em populações finitas.
Este efeito leva a perda de diversidade, mas novos alelos são adicionados por mutações.
Pode levar a grandes mudanças nas populações num curto período de tempo.
Como é que o nº de cópias de um alelo afeta o efeito da deriva genética?
- Poucas cópias de um alelo - efeito maior (fixação mais rápida de certos alelos ou genótipos)
- Muitas cópias - efeito menor
O que causa a deriva genética?
- Diminuições recorrentes do tamanho das populações
- Efeitos gargalo/bottleneck
- Efeitos fundadores
Que consequências tem a deriva genética?
- Fixação de alelos ou genótipos
- Aumento do coeficiente de endogamia
- Aumento dos pares homozigóticos
O que acontece quando um alelo é fixado?
- Deixa de haver deriva genética
- A frequência alélica não pode mudar, a não ser que outro alelo seja introduzido
Quais são os 4 maiores fatores de evolução?
- Mutação
- Seleção natural
- Fluxo genético
- Deriva genética
Quando é que é mais provável obter organismos homozigóticos?
Quando os seus parentes estão relacionados.
O que significa a sigla HO e HE?
HO - heterozigotia observada
HE - heterozigotia esperada
Heterozigotismo é marcador de diversidade genética numa população?
Sim.
Quanto maior o nº de indivíduos heterozigóticos, maior a diversidade genética.
O que significa a sigla SNV?
Single Nucleotide Variant
(sinónimo de SNP (snip))
Qual a percentagem mínima de SNPs no alelo menos frequente?
> 1%
O que é a distância genética?
É uma medida das diferenças entre populações.
Como se calcula a distância genética?
D(1,2) é a distância entre a população 1 e 2
D(1,2) = |freq. pop1 - freq. pop2|
Diz um método de formação de árvores filogenéticas.
Rep Neighbor Joining (juntamento das distâncias genéticas entre as populações)
Quais são os fatores que determinam a penetrância?
- Polimorfismos neutrais
- Polimorfismos funcionais
- Variantes suscetíveis
- Mutações de doença de alta penetrância
O que é a penetrância?
É a probabilidade de um alelo ser expresso num fenótipo.
O que significa a sigla LD?
Desequilíbrio de ligações
Em que consiste o desequilíbrio de ligações (LD)?
Associação não aleatória de alelos.
Quando é que ocorre equilíbrio de ligação?
Quando dois segmentos são herdados de forma independente, ou quando os segmentos estão no mesmo cromossoma, mas distantes.
O que é o GWAS?
Genome-Wide Association Studies
- Envolve o scan de muitos genomas para encontrar variantes genéticas associadas a características particulares.
- Procura por SNPs em todo o genoma, podendo levar à descoberta de centenas de funções genéticas em doenças comuns
Quais são os passos numa análise GWAS?
- Reunir os dados
- Fazer genotipagem
- Verificar a qualidade dos dados
- Imputação
- Testes de associação
- Meta-análise
- Replicação
- Análise pós-GWAS