Bases de datos Flashcards by Vicky 26

¿En que formato se deben ingresar los datos en los programas de análisis de secuencias?

Formato FASTA

How well did you know this?

Not at all

Perfectly

¿Cuál es el formato fasta?

estandariza la info. de manera muy simple facilitando la comunicación entre bases de datos:

signo >
a continuación, va una definición (identificador) de secuencia. no debe haber espacio entre el signo > y la primera letra de la definición.

How well did you know this?

Not at all

Perfectly

¿Qué son las bases de datos primarias?

Contienen datos de secuencias en bruto con alguna interpretación y explicación, pero sin verificación posterior.

How well did you know this?

Not at all

Perfectly

Hay 3 bases de datos principales que contienen todos los datos de secuencia generados hasta el momento e intercambian las secuencias diariamente:

GenBank (eeuu)
ENA (europa)
DDBJ (Japón)

How well did you know this?

Not at all

Perfectly

¿Que incluyen las 3 bases de datos principales?

Descripción de la secuencia
Nombre científico
Taxonomía del organismo
Tabla que identifica regiones codificantes
Referencias para las secuencias publicadas

How well did you know this?

Not at all

Perfectly

¿Qué son las bases de datos secundarias?

Son bases de datos verificadas y no redundantes que se derivan de las bases de datos primarias.

How well did you know this?

Not at all

Perfectly

¿Qué información proporcionan las bases de datos secundarias?

Caracterización de las secuencias
Mutaciones
análisis de polimorfismos
Estudios de expresión y análisis comparativos

How well did you know this?

Not at all

Perfectly

¿Qué tipo de base de datos es RefSeq?

Base de datos secundaria

How well did you know this?

Not at all

Perfectly

¿Cuál es una de las mejores bases de datos secundarias respecto a proteínas?

Swiss-Prot, que forma parte de un sistema de base de datos más grande llamado UniProtKB.

How well did you know this?

Not at all

Perfectly

¿Cuáles son las fuentes de la base de datos UniProtKB?

Secuencias codificantes traducidas en la base de datos de secuencias de nucleótidos
Datos procedentes de PDB (Protein Data Bank)
PIR (Protein Information Resource)
Secuencias enviadas directamente

How well did you know this?

Not at all

Perfectly

Base de datos secundaria

Compendio de genes humanos y fenotipos genéticos asociados a enfermedades.

OMIM

How well did you know this?

Not at all

Perfectly

BD secundaria

Base de datos de expresión génica de microarrays

ARRAYEXPRESS

How well did you know this?

Not at all

Perfectly

BD secundaria

Repositorio que archiva y distribuye datos de microarrays

GEO

How well did you know this?

Not at all

Perfectly

Bases de datos secundarias de ADN-ARN:

OMIM
ARRAYEXPRESS
GEO

How well did you know this?

Not at all

Perfectly

Bases de datos secundarias de proteínas

PRINTS
PFAM
INTERPRO
BIOGRID

How well did you know this?

Not at all

Perfectly

BD 2°

Colección de motivos conservados característicos de familias de proteínas

PRINTS

BD 2°

Base de datos de familias de proteínas

PFAM

BD 2°

Colección de proteínas clasificadas mediante la predicción de dominios funcionales

INTERPRO

BD 2°

Repositorio de interacciones entre proteínas

BIOGRID

¿Para que sirve el alineamiento de secuencias?

Al alinear dos secuencias se pueden encontrar regiones similares y esta similitud puede tener implicaciones evolutivas y funcionales

Tipos de alineamientos

Globales y locales

Alineamientos globales

Abarcan toda la longitud de las seuencias estudiadas

Alineamientos locales

Identifican regiones de similitud dentro de secuencias largas, que a menudo son divergentes en el resto de su longitud.

Los programas de comparación de secuencias y alineamiento más empleados por los científicos son herramientas de:

Alineamiento local

Programa de comparación de secuencias y alineamiento más conocido

BLAST

¿Para qué sirve BLAST?

Permite comparar una secuencia de consulta con una biblioteca o base de datos de secuencias e identificar secuencias de esa base que se asemeja a la secuencia de consulta por encima de un cierto umbral.