Unidade 3 - Bases de Dados Flashcards

1
Q

Que ferramentas (softwares) existem para a análise de NGS?

A
  • BAM (binary alignment map)
  • BAI (binary alignment index)
  • rCRS (sequência de referência de mtDNA)
  • Torrent browser variant caller (Ion Torrent)
  • Integrative genomics viewer (IGV)
  • NextGENe (SoftGenetics)
  • Sequencher (GeneCodes)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quais são as áreas emergentes nos testes e análises genéticas?

A
  • Variantes não codificantes
  • Teste de metilação de DNA
  • Melhorar a classificação de variantes
  • Variantes com características complexas
  • Determinação do risco em variantes com características complexas
  • Sequenciamento de leituras longas
  • Sequenciamento de uma célula
  • Progresso no cuidado de saúde personalizado de pacientes
  • Ligação clínica: classificação de variantes e clínica Epichroma
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

O que são TEs?

A

Elementos transponíveis

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Que tipos de alelos existem?

A
  • Alelos
  • Epialelos
  • Polialélico
  • Bialélico, trialélico, quadralélico
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

O que são alelos?

A

Alelos descrevem as formas alternativas de um gene. Cada pessoa herda 1 alelo de cada parente para cada gene autossomal.
Podem ser alelos normais/selvagens ou anormais/mutantes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

O que são epialelos?

A

Alelos que diferem nos padrões de expressão, devido às modificações epigenéticas em vez das alterações no DNA em si.

EPIalelos - EPIgenética

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Que efeitos podem ter alterações nos epialelos centroméricos?

A

Alteração da função do centrómero e estabilidade do cromossoma, o que pode conduzir a uma segregação cromossomal aberrante e desordens genéticas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

O que significa “polialélico”?

A

Existência de alelos múltiplos num locus específico.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Dá exemplos de polialelos.

A

Micro e minisatélites

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

O que significam os bialelos, trialelos ou quadralelos?

A

Referem-se ao nº de nucleótidos distintos (2/3/4) que existem numa posição de base específica de um alelo, numa população da espécie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

O que é um locus?

A

Localização cromossomal específica de um gene ou sequência

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

O que é um haplotipo?

A

Variações de DNA adjacentes uma à outra no mesmo locus, que tendem a ser herdadas juntas.
Pode ser referido como polimorfismos ligados

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Dá exemplos de haplotipos.

A

Polimorfismos como SNPs e indels

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Que utilidade têm os polimorfismos de DNA?

A
  • Estimativa da variação genética em populações diversas
  • Identificação de fatores de risco
  • Identificar indivíduos (ex.: forense, parentesco; monitorizar doenças virais ou bacterinas)
  • Associação com características desejáveis em animais e plantas
  • Monitorizar diversidade genética
  • Evolução e história de populações humanos; padrões de migração
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

O que são os “Genome Browsers”?

A

Programas que permitem o utilizador ver e pesquisar genomas inteiros, na forma de gráficos de dados genómicos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qual foi o primeiro genome browser?

A

The Saccharomyces Genome Database

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Qual é a diferença entre genome browsers e outras bases de dados?

A

Os genome browsers mostram os dados graficamente, com coordenadas de genomas num eixo e a localização das anotações no outro

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Que genome browsers existem para o genoma humano?

A
  • UCSC
  • Ensembl
  • Genome data viewer (NCBI)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

O genome browser “Ensembl” foca-se em que genomas?

A

Genomas de vertebrados.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Que tipo de análises podem ser feitas no Ensembl?

A
  • Genómica comparativa
  • Evolução
  • Variação de sequência e regulação de transcrição
  • Anotação de genes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Que ferramentas tem o Ensembl?

A
  • BLAST
  • BLAT
  • BioMart
  • VEP (Variant Effect Predictor)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Que dados são integrados nos genome browsers?

A
  • Sequências genómicas
  • Genes e marcadores
  • SNPs
  • Elementos funcionais não codificantes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Que ferramentas tem o genome browser UCSC?

A
  • BLAT
  • Table browser
  • Genome graphs
  • Gene sorter
  • VisiGene
  • Proteome browser
  • Procura de genes por termos
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

O que significam as caixas preenchidas e as linhas no UCSC?

A

Caixas preenchidas - exões
Linhas - intrões

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

O que significam as setas para a direita e esquerda no UCSC?

A

Setas p/ direita - cadeias sense
Setas p/ esquerda - cadeias anti-sense

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Quais são as principais características do browser UCSC?

A
  • Elevada quantidade de DNA
  • Personalizável
  • Páginas detalhadas
  • Alinhamento de sequências
  • Visualização de SNPs
  • Estudos de homozigotia
  • Definições de loci de doenças
  • Visualizar polimorfismos
  • Links para bases externas
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Como é organizada a informação no browser UCSC?

A

Por tracks.

Tracks são conjuntos específicos de dados ou anotações mostradas ao longo de uma região genómica

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

No browser UCSC, que tipos de tracks existem?

A
  • Bandas cromossómicas
  • Localização de gaps
  • Genes conhecidos
  • Genes preditivos
  • Doenças e fenótipos
  • Dados melhorados
  • Microarrays
  • Conservação evolutiva
  • SNPs
  • Posição da base
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

No UCSC a informação (tracks) pode ser compactada de diversas formas. Que opções tem?

A
  • Hide: torna o track invisível
  • Dense: conjuga todas as características numa linha
  • Squish: mostra cada característica numa linha separada sem etiquetas
  • Pack: mostra várias características em cada linha, com etiquetas
  • Full: mostra cada característica numa linha separada com etiquetas
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

O que é um “Assembly”?

A

É um conjunto de cromossomas, com sequências deslocalizadas e loci alternativos, usados para representar o genoma humano.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

Com que frequência são atualizadas as assemblies?

A

Sempre que saem novos dados.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

Como se faz uma assembly?

A

Genoma -> cortar em pedaços -> clonar em vetores -> sequenciar clones -> montar as sequências em contigs -> montar os contigs em scaffolds -> mapear

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

O que faz a ferramenta Blat?

A

Ferramenta de alinhamento rápido que permite ao utilizador alinhar DNA ou sequências proteicas às assemblies do genoma

34
Q

O que faz a ferramenta Table Browser?

A

Interface que permite recuperar dados associados aos tracks

35
Q

O que faz a ferramenta Genome graphs?

A

Facilita a visualização de conjuntos de dados do genoma inteiro, como GWAS, etc

36
Q

O que faz a ferramenta Gene Sorter?

A

Mostra uma tabela de genes que são semelhantes em algum parâmetro

37
Q

O que faz a ferramenta VisiGene?

A

Microscópio virtual para ver imagens de hibridização in situ.

38
Q

O que faz a ferramenta Proteome Browser?

A

Permite ver proteínas e as suas propriedades

39
Q

O que é o “Valor C”?

A

É o total de DNA num genoma haplóide.

40
Q

O que entende por paradoxo do valor C?

A

O paradoxo está na discrepância entre o valor C (tamanho do genoma) e a complexidade do organismo.

41
Q

Quantos nucleótidos tem o DNA nuclear humano?

A

3 biliões

42
Q

Quantos nucleótidos tem o DNA mitocondrial humano?

A

16.500

42
Q

Quantos nucleótidos tem o DNA nuclear de E. coli?

A

5 milhões

42
Q

A que organismo pertence o maior genoma? Que tamanho tem?

A

Paris japonica - 50 vezes maior que o genoma humano

43
Q

Quantos pares de cromossomas tem o genoma humano?

A

23

44
Q

Quantos pares de cromossomas tem a Drosophila?

A

5

45
Q

Quantos pares de cromossomas tem a planta feto?

A

> 250

46
Q

Que gama de tamanhos têm os cromossomas humanos?

A

Mín - 50 Mb (cromossoma 21)
Máx - 263 Mb (cromossoma 1)

47
Q

Que percentagem do genoma humano é não codificante’?

A

98,5%

48
Q

Que percentagem do genoma humano é transcrita?

A

80%

49
Q

Quantos SNPs tem cada genoma humano?

A

3 milhões

50
Q

Que proporção de nucleótidos difere do genoma de um humano para o de um chimpanzé?

A

1,3%

51
Q

Que proporção de nucleótidos difere entre o genoma de quaisquer dois humanos?

A

0,1%

52
Q

Que percentagem do genoma humano está conservada em relação ao genoma de mamíferos?

A

5%

53
Q

Quantos genes humanos codificam para proteínas?

A

20.000

54
Q

Quantos genes de RNA não codificante tem o genoma humano?

A

25.000

55
Q

Quantos pseudogenes que podem ser transcritos, mas não traduzidos, tem o genoma humano?

A

14.000

56
Q

Qual é o tamanho médio dos genes humanos?

A

10.000 a 15.000 nucleótidos

57
Q

Qual é o maior gene humano?

A

Gene DMD (gene distrofina)
- 2.4 milhões de nucleótidos
- Codifica uma proteína com 3685 aminoácidos

58
Q

Que gene codifica a maior proteína humana?

A

Gene TTN (titina)
- Proteína de 34.350 aminoácidos

59
Q
A
60
Q
A
61
Q

Que gene codifica a menor proteína humana?

A

Gene da histona
- < 500 nucleótidos

62
Q

Quantas cópias do genoma mitocondrial humano existem no citoplasma?

A

500 a 1000

63
Q

Quantas cópias do genoma mitocondrial humano existem no núcleo?

A

2 em média

64
Q

Qual é o nº médio de exões num gene?

A

8,8

65
Q

DNA e genes são a mesma coisa?

A

Não

66
Q

O que é o Repitoma?

A

É a coleção completa de sequências de DNA repetitivo presentes num genoma.

67
Q

Que funções desempenha o Repitoma?

A
  • Regulação da cromatina
  • Regulação dos genes
  • Papeis estruturais em funções vitais, como a segregação ou preservação do material genético
68
Q

O Repitoma compõe uma parte pequena ou grande do genoma humano?

A

Grande.
Pouco menos de metade.

69
Q

O que são as Tandem Repeats (TRs)?

A
  • São cópias múltiplas de repetições curtas com propriedades raras, como a possibilidade de serem identificadas como um pico separado numa análise de gradiente de densidades de DNA.
  • Representam uma das classes de variantes mais abundantes.
  • São polimórficos e multialélicos por natureza.
  • São altamente instáveis quando longos.
  • Têm a taxa mutacional mais elevada no genoma.
  • Espalhados principalmente nas regiões não-codificantes do genoma.
70
Q

Onde são principalmente encontrados os TRs?

A

Nas regiões não-codificantes do genoma

71
Q

O que são as repetições em tripletos?

A

Repetições de tripletos (CAG|CAG|CAG|CAG|…), limitadas em tamanho

Encontradas em regiões codificantes dos genes, e podem tornar-se focos para mutações frameshift prejudiciais

72
Q

O que significa STR?

A

Short Tandem Repeat

73
Q

Que tipos de STRs existem?

A
  • STRs que afetam as regiões codificantes
  • Regiões não-codificantes dos genes
74
Q

Que consequências têm os STRs que afetam as regiões codificantes dos genes?

A

Levam a fragmentos anormalmente longos de poliglutamina ou polialanina em proteínas

  • Poliglutamina (polyQ, principalmente codificada por codões CAG)
  • Polialanina (polyA, codificado por codões GCN)
75
Q

Quais são os principais mecanismos associados a expansões de repetições?

A
  • Metilação de DNA - silenciamento epigenético
  • Missplicing
  • Tradução canónica
  • Inclusões nucleares
76
Q

O que significa UTR?

A

Untranslated region

Região não-traduzida

77
Q

Onde estão localizadas as expansões hipermetiladas?

A

Em promotores ou 5’-UTRs encontram expansões grandes e ricas em GC que estão associadas à hipermetilação do DNA

78
Q

O que acontece quando o DNA é hipermetilado?

A

Alelos metilados ficam presos numa configuração de cromatina que previne a expressão genética e leva à perda de função do alelo expandido

79
Q

Dá exemplos de mecanismos de expansões hipermetiladas.

A

Expansões em FMR1 - Síndrome de X frágil
Expansões em XYLT1 - Síndrome Scott-Baratela