Unidade 3 - Bases de Dados Flashcards
Que ferramentas (softwares) existem para a análise de NGS?
- BAM (binary alignment map)
- BAI (binary alignment index)
- rCRS (sequência de referência de mtDNA)
- Torrent browser variant caller (Ion Torrent)
- Integrative genomics viewer (IGV)
- NextGENe (SoftGenetics)
- Sequencher (GeneCodes)
Quais são as áreas emergentes nos testes e análises genéticas?
- Variantes não codificantes
- Teste de metilação de DNA
- Melhorar a classificação de variantes
- Variantes com características complexas
- Determinação do risco em variantes com características complexas
- Sequenciamento de leituras longas
- Sequenciamento de uma célula
- Progresso no cuidado de saúde personalizado de pacientes
- Ligação clínica: classificação de variantes e clínica Epichroma
O que são TEs?
Elementos transponíveis
Que tipos de alelos existem?
- Alelos
- Epialelos
- Polialélico
- Bialélico, trialélico, quadralélico
O que são alelos?
Alelos descrevem as formas alternativas de um gene. Cada pessoa herda 1 alelo de cada parente para cada gene autossomal.
Podem ser alelos normais/selvagens ou anormais/mutantes.
O que são epialelos?
Alelos que diferem nos padrões de expressão, devido às modificações epigenéticas em vez das alterações no DNA em si.
EPIalelos - EPIgenética
Que efeitos podem ter alterações nos epialelos centroméricos?
Alteração da função do centrómero e estabilidade do cromossoma, o que pode conduzir a uma segregação cromossomal aberrante e desordens genéticas.
O que significa “polialélico”?
Existência de alelos múltiplos num locus específico.
Dá exemplos de polialelos.
Micro e minisatélites
O que significam os bialelos, trialelos ou quadralelos?
Referem-se ao nº de nucleótidos distintos (2/3/4) que existem numa posição de base específica de um alelo, numa população da espécie.
O que é um locus?
Localização cromossomal específica de um gene ou sequência
O que é um haplotipo?
Variações de DNA adjacentes uma à outra no mesmo locus, que tendem a ser herdadas juntas.
Pode ser referido como polimorfismos ligados
Dá exemplos de haplotipos.
Polimorfismos como SNPs e indels
Que utilidade têm os polimorfismos de DNA?
- Estimativa da variação genética em populações diversas
- Identificação de fatores de risco
- Identificar indivíduos (ex.: forense, parentesco; monitorizar doenças virais ou bacterinas)
- Associação com características desejáveis em animais e plantas
- Monitorizar diversidade genética
- Evolução e história de populações humanos; padrões de migração
O que são os “Genome Browsers”?
Programas que permitem o utilizador ver e pesquisar genomas inteiros, na forma de gráficos de dados genómicos
Qual foi o primeiro genome browser?
The Saccharomyces Genome Database
Qual é a diferença entre genome browsers e outras bases de dados?
Os genome browsers mostram os dados graficamente, com coordenadas de genomas num eixo e a localização das anotações no outro
Que genome browsers existem para o genoma humano?
- UCSC
- Ensembl
- Genome data viewer (NCBI)
O genome browser “Ensembl” foca-se em que genomas?
Genomas de vertebrados.
Que tipo de análises podem ser feitas no Ensembl?
- Genómica comparativa
- Evolução
- Variação de sequência e regulação de transcrição
- Anotação de genes
Que ferramentas tem o Ensembl?
- BLAST
- BLAT
- BioMart
- VEP (Variant Effect Predictor)
Que dados são integrados nos genome browsers?
- Sequências genómicas
- Genes e marcadores
- SNPs
- Elementos funcionais não codificantes
Que ferramentas tem o genome browser UCSC?
- BLAT
- Table browser
- Genome graphs
- Gene sorter
- VisiGene
- Proteome browser
- Procura de genes por termos
O que significam as caixas preenchidas e as linhas no UCSC?
Caixas preenchidas - exões
Linhas - intrões
O que significam as setas para a direita e esquerda no UCSC?
Setas p/ direita - cadeias sense
Setas p/ esquerda - cadeias anti-sense
Quais são as principais características do browser UCSC?
- Elevada quantidade de DNA
- Personalizável
- Páginas detalhadas
- Alinhamento de sequências
- Visualização de SNPs
- Estudos de homozigotia
- Definições de loci de doenças
- Visualizar polimorfismos
- Links para bases externas
Como é organizada a informação no browser UCSC?
Por tracks.
Tracks são conjuntos específicos de dados ou anotações mostradas ao longo de uma região genómica
No browser UCSC, que tipos de tracks existem?
- Bandas cromossómicas
- Localização de gaps
- Genes conhecidos
- Genes preditivos
- Doenças e fenótipos
- Dados melhorados
- Microarrays
- Conservação evolutiva
- SNPs
- Posição da base
No UCSC a informação (tracks) pode ser compactada de diversas formas. Que opções tem?
- Hide: torna o track invisível
- Dense: conjuga todas as características numa linha
- Squish: mostra cada característica numa linha separada sem etiquetas
- Pack: mostra várias características em cada linha, com etiquetas
- Full: mostra cada característica numa linha separada com etiquetas
O que é um “Assembly”?
É um conjunto de cromossomas, com sequências deslocalizadas e loci alternativos, usados para representar o genoma humano.
Com que frequência são atualizadas as assemblies?
Sempre que saem novos dados.
Como se faz uma assembly?
Genoma -> cortar em pedaços -> clonar em vetores -> sequenciar clones -> montar as sequências em contigs -> montar os contigs em scaffolds -> mapear