Bases de datos Flashcards
¿Cómo se ingresa la información en programas de análisis de secuencias?
En formato Fasta, que permite estandarizar y comunicar datos de manera simple. La línea de definición inicia con > y contiene el identificador de la secuencia.
¿Cuáles son las principales bases de datos primarias para secuencias?
- GenBank (EE. UU.)
- ENA (Europa)
- DDBJ (Japón)
Intercambian datos diariamente, incluyendo descripción, taxonomía y referencias bibliográficas.
¿Qué caracteriza a las bases de datos secundarias?
Son verificadas, no redundantes, derivadas de primarias.
Ejemplos:
- RefSeq para nucleótidos
- Swiss-Prot en UniProtKB para proteínas.
¿Cuáles son las fuentes de secuencias en UniProtKB?
- Secuencias codificantes traducidas de la base de datos de secuencias de nucleótidos.
- Datos de PDB (Protein Data Bank).
- PIR (Protein Information Resource).
- Secuencias enviadas directamente a UniProtKB.
¿Cuáles son ejemplos de bases de datos para ADN-ARN?
- OMIM para genes humanos,
- ARRAYEXPRESS para expresión génica de microarrays
- GEO archiva y distribuye datos de microarrays.
¿Nombra bases de datos de proteínas y sus funciones?
- PRINTS: Motivos conservados en familias de proteínas.
- PFAM: Familias de proteínas.
- INTERPRO: Clasificación por predicción de dominios funcionales.
- BIOGRID: Repositorio de interacciones entre proteínas.
¿Por qué se realizan alineamientos de secuencias?
Para identificar regiones similares con implicaciones evolutivas y funcionales. Pueden ser globales (toda la longitud) o locales (regiones específicas).
¿Cuáles son las herramientas más empleadas por los científicos para el alineamiento de secuencias?
Las herramientas más empleadas son de alineamiento local.
- la más utilizada es BLAST
¿Qué es BLAST y cuál es su función principal?
(Basic Local Alignment Search Tool)
BLAST es un algoritmo utilizado para comparar información de secuencias biológicas primarias, como nucleótidos de ADN o aminoácidos de proteínas.
¿Cómo funciona una búsqueda BLAST?
Una búsqueda BLAST permite comparar una secuencia de consulta con una base de datos de secuencias. Identifica secuencias similares por encima de un cierto umbral de similitud.
¿Para qué se emplean los alineamientos de secuencias?
- Identificación de secuencias problema
- motivos funcionales
- mutaciones
- anotación de genomas.