Unidade 3 - Bases de Dados Flashcards
Que ferramentas (softwares) existem para a análise de NGS?
- BAM (binary alignment map)
- BAI (binary alignment index)
- rCRS (sequência de referência de mtDNA)
- Torrent browser variant caller (Ion Torrent)
- Integrative genomics viewer (IGV)
- NextGENe (SoftGenetics)
- Sequencher (GeneCodes)
Quais são as áreas emergentes nos testes e análises genéticas?
- Variantes não codificantes
- Teste de metilação de DNA
- Melhorar a classificação de variantes
- Variantes com características complexas
- Determinação do risco em variantes com características complexas
- Sequenciamento de leituras longas
- Sequenciamento de uma célula
- Progresso no cuidado de saúde personalizado de pacientes
- Ligação clínica: classificação de variantes e clínica Epichroma
O que são TEs?
Elementos transponíveis
Que tipos de alelos existem?
- Alelos
- Epialelos
- Polialélico
- Bialélico, trialélico, quadralélico
O que são alelos?
Alelos descrevem as formas alternativas de um gene. Cada pessoa herda 1 alelo de cada parente para cada gene autossomal.
Podem ser alelos normais/selvagens ou anormais/mutantes.
O que são epialelos?
Alelos que diferem nos padrões de expressão, devido às modificações epigenéticas em vez das alterações no DNA em si.
EPIalelos - EPIgenética
Que efeitos podem ter alterações nos epialelos centroméricos?
Alteração da função do centrómero e estabilidade do cromossoma, o que pode conduzir a uma segregação cromossomal aberrante e desordens genéticas.
O que significa “polialélico”?
Existência de alelos múltiplos num locus específico.
Dá exemplos de polialelos.
Micro e minisatélites
O que significam os bialelos, trialelos ou quadralelos?
Referem-se ao nº de nucleótidos distintos (2/3/4) que existem numa posição de base específica de um alelo, numa população da espécie.
O que é um locus?
Localização cromossomal específica de um gene ou sequência
O que é um haplotipo?
Variações de DNA adjacentes uma à outra no mesmo locus, que tendem a ser herdadas juntas.
Pode ser referido como polimorfismos ligados
Dá exemplos de haplotipos.
Polimorfismos como SNPs e indels
Que utilidade têm os polimorfismos de DNA?
- Estimativa da variação genética em populações diversas
- Identificação de fatores de risco
- Identificar indivíduos (ex.: forense, parentesco; monitorizar doenças virais ou bacterinas)
- Associação com características desejáveis em animais e plantas
- Monitorizar diversidade genética
- Evolução e história de populações humanos; padrões de migração
O que são os “Genome Browsers”?
Programas que permitem o utilizador ver e pesquisar genomas inteiros, na forma de gráficos de dados genómicos
Qual foi o primeiro genome browser?
The Saccharomyces Genome Database
Qual é a diferença entre genome browsers e outras bases de dados?
Os genome browsers mostram os dados graficamente, com coordenadas de genomas num eixo e a localização das anotações no outro
Que genome browsers existem para o genoma humano?
- UCSC
- Ensembl
- Genome data viewer (NCBI)
O genome browser “Ensembl” foca-se em que genomas?
Genomas de vertebrados.
Que tipo de análises podem ser feitas no Ensembl?
- Genómica comparativa
- Evolução
- Variação de sequência e regulação de transcrição
- Anotação de genes
Que ferramentas tem o Ensembl?
- BLAST
- BLAT
- BioMart
- VEP (Variant Effect Predictor)
Que dados são integrados nos genome browsers?
- Sequências genómicas
- Genes e marcadores
- SNPs
- Elementos funcionais não codificantes
Que ferramentas tem o genome browser UCSC?
- BLAT
- Table browser
- Genome graphs
- Gene sorter
- VisiGene
- Proteome browser
- Procura de genes por termos
O que significam as caixas preenchidas e as linhas no UCSC?
Caixas preenchidas - exões
Linhas - intrões
O que significam as setas para a direita e esquerda no UCSC?
Setas p/ direita - cadeias sense
Setas p/ esquerda - cadeias anti-sense
Quais são as principais características do browser UCSC?
- Elevada quantidade de DNA
- Personalizável
- Páginas detalhadas
- Alinhamento de sequências
- Visualização de SNPs
- Estudos de homozigotia
- Definições de loci de doenças
- Visualizar polimorfismos
- Links para bases externas
Como é organizada a informação no browser UCSC?
Por tracks.
Tracks são conjuntos específicos de dados ou anotações mostradas ao longo de uma região genómica
No browser UCSC, que tipos de tracks existem?
- Bandas cromossómicas
- Localização de gaps
- Genes conhecidos
- Genes preditivos
- Doenças e fenótipos
- Dados melhorados
- Microarrays
- Conservação evolutiva
- SNPs
- Posição da base
No UCSC a informação (tracks) pode ser compactada de diversas formas. Que opções tem?
- Hide: torna o track invisível
- Dense: conjuga todas as características numa linha
- Squish: mostra cada característica numa linha separada sem etiquetas
- Pack: mostra várias características em cada linha, com etiquetas
- Full: mostra cada característica numa linha separada com etiquetas
O que é um “Assembly”?
É um conjunto de cromossomas, com sequências deslocalizadas e loci alternativos, usados para representar o genoma humano.
Com que frequência são atualizadas as assemblies?
Sempre que saem novos dados.
Como se faz uma assembly?
Genoma -> cortar em pedaços -> clonar em vetores -> sequenciar clones -> montar as sequências em contigs -> montar os contigs em scaffolds -> mapear
O que faz a ferramenta Blat?
Ferramenta de alinhamento rápido que permite ao utilizador alinhar DNA ou sequências proteicas às assemblies do genoma
O que faz a ferramenta Table Browser?
Interface que permite recuperar dados associados aos tracks
O que faz a ferramenta Genome graphs?
Facilita a visualização de conjuntos de dados do genoma inteiro, como GWAS, etc
O que faz a ferramenta Gene Sorter?
Mostra uma tabela de genes que são semelhantes em algum parâmetro
O que faz a ferramenta VisiGene?
Microscópio virtual para ver imagens de hibridização in situ.
O que faz a ferramenta Proteome Browser?
Permite ver proteínas e as suas propriedades
O que é o “Valor C”?
É o total de DNA num genoma haplóide.
O que entende por paradoxo do valor C?
O paradoxo está na discrepância entre o valor C (tamanho do genoma) e a complexidade do organismo.
Quantos nucleótidos tem o DNA nuclear humano?
3 biliões
Quantos nucleótidos tem o DNA mitocondrial humano?
16.500
Quantos nucleótidos tem o DNA nuclear de E. coli?
5 milhões
A que organismo pertence o maior genoma? Que tamanho tem?
Paris japonica - 50 vezes maior que o genoma humano
Quantos pares de cromossomas tem o genoma humano?
23
Quantos pares de cromossomas tem a Drosophila?
5
Quantos pares de cromossomas tem a planta feto?
> 250
Que gama de tamanhos têm os cromossomas humanos?
Mín - 50 Mb (cromossoma 21)
Máx - 263 Mb (cromossoma 1)
Que percentagem do genoma humano é não codificante’?
98,5%
Que percentagem do genoma humano é transcrita?
80%
Quantos SNPs tem cada genoma humano?
3 milhões
Que proporção de nucleótidos difere do genoma de um humano para o de um chimpanzé?
1,3%
Que proporção de nucleótidos difere entre o genoma de quaisquer dois humanos?
0,1%
Que percentagem do genoma humano está conservada em relação ao genoma de mamíferos?
5%
Quantos genes humanos codificam para proteínas?
20.000
Quantos genes de RNA não codificante tem o genoma humano?
25.000
Quantos pseudogenes que podem ser transcritos, mas não traduzidos, tem o genoma humano?
14.000
Qual é o tamanho médio dos genes humanos?
10.000 a 15.000 nucleótidos
Qual é o maior gene humano?
Gene DMD (gene distrofina)
- 2.4 milhões de nucleótidos
- Codifica uma proteína com 3685 aminoácidos
Que gene codifica a maior proteína humana?
Gene TTN (titina)
- Proteína de 34.350 aminoácidos
Que gene codifica a menor proteína humana?
Gene da histona
- < 500 nucleótidos
Quantas cópias do genoma mitocondrial humano existem no citoplasma?
500 a 1000
Quantas cópias do genoma mitocondrial humano existem no núcleo?
2 em média
Qual é o nº médio de exões num gene?
8,8
DNA e genes são a mesma coisa?
Não
O que é o Repitoma?
É a coleção completa de sequências de DNA repetitivo presentes num genoma.
Que funções desempenha o Repitoma?
- Regulação da cromatina
- Regulação dos genes
- Papeis estruturais em funções vitais, como a segregação ou preservação do material genético
O Repitoma compõe uma parte pequena ou grande do genoma humano?
Grande.
Pouco menos de metade.
O que são as Tandem Repeats (TRs)?
- São cópias múltiplas de repetições curtas com propriedades raras, como a possibilidade de serem identificadas como um pico separado numa análise de gradiente de densidades de DNA.
- Representam uma das classes de variantes mais abundantes.
- São polimórficos e multialélicos por natureza.
- São altamente instáveis quando longos.
- Têm a taxa mutacional mais elevada no genoma.
- Espalhados principalmente nas regiões não-codificantes do genoma.
Onde são principalmente encontrados os TRs?
Nas regiões não-codificantes do genoma
O que são as repetições em tripletos?
Repetições de tripletos (CAG|CAG|CAG|CAG|…), limitadas em tamanho
Encontradas em regiões codificantes dos genes, e podem tornar-se focos para mutações frameshift prejudiciais
O que significa STR?
Short Tandem Repeat
Que tipos de STRs existem?
- STRs que afetam as regiões codificantes
- Regiões não-codificantes dos genes
Que consequências têm os STRs que afetam as regiões codificantes dos genes?
Levam a fragmentos anormalmente longos de poliglutamina ou polialanina em proteínas
- Poliglutamina (polyQ, principalmente codificada por codões CAG)
- Polialanina (polyA, codificado por codões GCN)
Quais são os principais mecanismos associados a expansões de repetições?
- Metilação de DNA - silenciamento epigenético
- Missplicing
- Tradução canónica
- Inclusões nucleares
O que significa UTR?
Untranslated region
Região não-traduzida
Onde estão localizadas as expansões hipermetiladas?
Em promotores ou 5’-UTRs encontram expansões grandes e ricas em GC que estão associadas à hipermetilação do DNA
O que acontece quando o DNA é hipermetilado?
Alelos metilados ficam presos numa configuração de cromatina que previne a expressão genética e leva à perda de função do alelo expandido
Dá exemplos de mecanismos de expansões hipermetiladas.
Expansões em FMR1 - Síndrome de X frágil
Expansões em XYLT1 - Síndrome Scott-Baratela