Bases de datos Flashcards

1
Q

¿En que formato se deben ingresar los datos en los programas de análisis de secuencias?

A

Formato FASTA

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

¿Cuál es el formato fasta?

A

estandariza la info. de manera muy simple facilitando la comunicación entre bases de datos:

  • signo >
  • a continuación, va una definición (identificador) de secuencia. no debe haber espacio entre el signo > y la primera letra de la definición.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

¿Qué son las bases de datos primarias?

A

Contienen datos de secuencias en bruto con alguna interpretación y explicación, pero sin verificación posterior.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hay 3 bases de datos principales que contienen todos los datos de secuencia generados hasta el momento e intercambian las secuencias diariamente:

A
  • GenBank (eeuu)
  • ENA (europa)
  • DDBJ (Japón)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

¿Que incluyen las 3 bases de datos principales?

A
  • Descripción de la secuencia
  • Nombre científico
  • Taxonomía del organismo
  • Tabla que identifica regiones codificantes
  • Referencias para las secuencias publicadas
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

¿Qué son las bases de datos secundarias?

A

Son bases de datos verificadas y no redundantes que se derivan de las bases de datos primarias.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

¿Qué información proporcionan las bases de datos secundarias?

A
  • Caracterización de las secuencias
  • Mutaciones
  • análisis de polimorfismos
  • Estudios de expresión y análisis comparativos
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

¿Qué tipo de base de datos es RefSeq?

A

Base de datos secundaria

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

¿Cuál es una de las mejores bases de datos secundarias respecto a proteínas?

A

Swiss-Prot, que forma parte de un sistema de base de datos más grande llamado UniProtKB.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

¿Cuáles son las fuentes de la base de datos UniProtKB?

A
  • Secuencias codificantes traducidas en la base de datos de secuencias de nucleótidos
  • Datos procedentes de PDB (Protein Data Bank)
  • PIR (Protein Information Resource)
  • Secuencias enviadas directamente
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Base de datos secundaria

Compendio de genes humanos y fenotipos genéticos asociados a enfermedades.

A

OMIM

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

BD secundaria

Base de datos de expresión génica de microarrays

A

ARRAYEXPRESS

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

BD secundaria

Repositorio que archiva y distribuye datos de microarrays

A

GEO

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Bases de datos secundarias de ADN-ARN:

A
  • OMIM
  • ARRAYEXPRESS
  • GEO
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Bases de datos secundarias de proteínas

A
  • PRINTS
  • PFAM
  • INTERPRO
  • BIOGRID
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

BD 2°

Colección de motivos conservados característicos de familias de proteínas

A

PRINTS

16
Q

BD 2°

Base de datos de familias de proteínas

A

PFAM

17
Q

BD 2°

Colección de proteínas clasificadas mediante la predicción de dominios funcionales

A

INTERPRO

18
Q

BD 2°

Repositorio de interacciones entre proteínas

A

BIOGRID

19
Q

¿Para que sirve el alineamiento de secuencias?

A

Al alinear dos secuencias se pueden encontrar regiones similares y esta similitud puede tener implicaciones evolutivas y funcionales

20
Q

Tipos de alineamientos

A

Globales y locales

21
Q

Alineamientos globales

A

Abarcan toda la longitud de las seuencias estudiadas

22
Q

Alineamientos locales

A

Identifican regiones de similitud dentro de secuencias largas, que a menudo son divergentes en el resto de su longitud.

23
Q

Los programas de comparación de secuencias y alineamiento más empleados por los científicos son herramientas de:

A

Alineamiento local

24
Q

Programa de comparación de secuencias y alineamiento más conocido

A

BLAST

25
Q

¿Para qué sirve BLAST?

A

Permite comparar una secuencia de consulta con una biblioteca o base de datos de secuencias e identificar secuencias de esa base que se asemeja a la secuencia de consulta por encima de un cierto umbral.

26
Q

2

A