TP - BLAST Flashcards

1
Q

O que significa a sigla BLAST?

A

Basic Local Assignment Search Tool

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

O que é o Query?

A

Sequência de DNA ou proteína submetida a uma base de dados para ser comparada

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Como se calcula a % de identidade?

A

nº de resíduos idênticos / nº total de matches

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

O que nos diz a % de identidade?

A

Define a percentagem de aminoácidos (ou nucleótidos) com uma correspondência direta no alinhamento

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

O que significa quando existe uma elevada similaridade?

A

Implica que pode haver um ancestral comum ou uma função em comum

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Como é expressa a similaridade?

A

Em % de identidade

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

O que significa o termo “Homologia”?

A

Refere-se a características (genes ou funções) que descenderam de um ancestral comum.
Implica uma relação evolucionária.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

O que significa o termo “Ortólogo”?

A

Genes ortólogos evoluiram de um ancestral comum, podendo diferir na sua função e sequência genética, mas possuem o mesmo papel biológico básico

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

O que significa o termo “Parálogo”?

A

Genes parálogos surgem de eventos de duplicação durante a evolução.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

O que é uma substituição conservativa?

A

É quando um aminoácido sofre uma mutação para um resíduo semelhante, mas as suas propriedades não se alteram.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Como se calcula o comprimento de query?

A

nº de nucleótidos / a.a na sequência pesquisada

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

O que é a cobertura de query?

A

É o quanto a sequência está coberta por alinhamentos significativos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

O que é o “E value”?

A

Expected value.
Probabilidade de um match ocorrer por acaso.
Idealmente deve ser próximo de 0.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Para que servem as gap penalties?

A

Para ajustar o score do alinhamento, de acordo com o nº e comprimento dos gaps.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qual é o sistema de pontuação em scores de alinhamento?

A

Correspondência de base (+1)
Não-correspondência de base (-1)
Gap penalty (-2)
Gap penalties seguidos (-11; -1 (..))

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Que consequências podem haver quando há demasiados gaps?

A

A sequência pode deixar de fazer sentido.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

O que significa o valor de score de alinhamento?

A

Representa a semelhança entre as sequências.
Quanto maior o score, maior é a significância do “hit”

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

O que são raw scores?

A

São scores calculados a partir da matriz.

19
Q

O que são bit scores?

A

São scores normalizados e comparáveis entre pesquisas para considerar diferentes matrizes e bases de dados.

20
Q

O que significa a sigla HSP?

A

High Scoring Pair

21
Q

O que são os HSPs?

A

São duas sequências de igual tamanho e que, quando alinhadas, possuem o score máximo

22
Q

Qual é o sistema de pontuação em scores de matrizes?

A

Base correspondente (+2)
Base não-correspondente (-3)
a.a raro correspondente - pontos máximos

23
Q

Existem 4 matrizes de score diferentes, quais? Qual delas é mais eficaz?

A

BLOSUM 90
BLOSUM 80
BLOSUM 62 - mais eficaz em encontrar todas as potenciais similaridades (30-40% semelhanças)
BLOSUM 30

24
Q

Qual é a diferença entre o alinhamento de sequências local e o global?

A

Local: compara partes de sequências
Global: compara sequências inteiras

25
Q

RefSeq é redundante ou não-redundante?

A

não-redundante

26
Q

Para que serve o BLASTX?

A

Para identificar regiões codificantes de proteínas em sequências de nucleótidos

27
Q

Para que serve o TBLASTN?

A

Para pesquisar sequências de nucleótidos que codificam proteínas semelhantes à sequência query.

28
Q

O que são os “accession numbers”?

A

Identificadores associados à sequência submetida na base de dados

29
Q

Quais são os 3 passos/regras para refinar sequencialmente os potenciais HSPs?

A

1 - Seeding
2 - Extensão
3 - Avaliação

30
Q

Explica o 1º passo (Seeding) do refinamento de potenciais HSPs.

A

Determinação das localizações de todas as words comuns (word hits).
Quanto maior o tamanho da word, menos hits vai gerar.

31
Q

Explica o 2º passo (Extensão) do refinamento de potenciais HSPs.

A

Após encontrar um hit, extender o hit em ambas as direções.
Para antes do score cair abaixo do cutoff.

32
Q

Explica o 3º passo (Avaliação) do refinamento de potenciais HSPs.

A

Avaliação com E-values.

33
Q

O que são “words” no BLAST?

A

São o nº de letras.

34
Q

O que são words vizinhas?

A

São sequências iguais à query onde apenas muda um nucleótido.

35
Q

O que é um “hit”?

A

É uma correspondência entre uma word e uma entry (entrada) na base de dados.

36
Q

O que é o “W”?

A

É o tamanho da word.

37
Q

O que é o “T”?

A

É o threshold (limite) do score da word vizinha.

38
Q

Para que serve o “T”?

A

É usado para reduzir o nº possível de words correspondentes.
Words com scores >T permanecem na lista de possíveis words correspondentes. Quando score<T, a word é descartada.

39
Q

Que efeitos positivos e negativos tem um elevado valor de “T”?

A
  • Remove mais hits de words, reduzindo o espaço de pesquisa
  • BLAST tem uma execução mais rápida
  • Perda de sensibilidade
40
Q

O que é uma sequência canónica?

A

É uma sequência de DNA/RNA/a.a que reflete a escolha mais comum de base para cada posição

41
Q

O que são os cutoffs ou guidelines?

A

São os limites de E-value, % de identidade que permite analisar

42
Q

Que utilidade tem a ferramenta de filtrar?

A

Permite filtrar os resultados para não alinhar com sequências com muitas bases iguais (porque são pouco específicas)

43
Q

O que são as posições homoplásicas?

A

São reversões de mutação.
(espécies diferentes passam a ter características iguais)

44
Q

O que é a hipermutabilidade?

A

São os hotspots mutacionais, onde existe uma taxa de mutação muito elevada.