Bases de Datos y conceptos básicos Flashcards

Dr. César Poot

1
Q

Bioinformática es:

A

Ciencia encargada del análisis y gestión de datos biológicos usando computadoras/recursos computacionales

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Genoma es:

A

Colección de todo el ADN de un organismo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Epigenoma es:

A

Colección de todas las modificaciones del ADN de un organismo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Transcriptoma es:

A

Conjunto completo de moléculas de ARN (transcritos) presentes en una célula o un grupo de células en un momento específico

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Proteoma es:

A

Colección de todas las proteínas que se expresan en un momento específico

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Open reading frame (ORF) es:

A

todos los genes codificantes que dan lugar a una proteína

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Maneras de secuenciar ácidos nucleicos

A
  • Método de Sanger (secuenciación por terminación de cadena)
  • Secuenciación de próxima generación (NGS)
  • Secuenciación de tercera generación
  • Secuenciación de ARN (RNA-seq)
  • Secuenciación de exomas
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

¿En qué consiste el Método de Sanger?

A

Síntesis de ADN en presencia de dideoxinucleótidos (ddNTPs)

Los fragmentos resultantes se separan por electroforesis.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Secuenciación de próxima generación (NGS) consiste en:

A

secuenciación de millones de fragmentos de ADN en paralelo

más velocidad, menos costo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Secuenciación de tercera generación consiste en:

A

secuenciación de moléculas de ADN individuales sin la necesidad de amplificación

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Secuenciación de ARN (RNA-seq) consiste en:

A

conversión de ARN a ADN complementario (cDNA)

luego utiliza técnicas NGS

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Secuenciación de exomas consiste en:

A

secuenciar sólo las regiones codificantes del genoma (exones)

los exones contienen la mayoría de las variantes responsables de enfermedades genéticas

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

¿Qué es DCell?

A

red neuronal artificial para predecir funcionamiento celular

(algoritmos de caja negra)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Una base de datos es:

A

colección de información

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Características de una base de datos

A
  • Tabla de contenidos (indexeada)
  • Optimizadas
  • Compuestas de varias tablas (con id, mapid, nrid)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Datos que pueden contener las BD

A

secuencias de DNA
proteínas 3D
geles 2D
microarreglos

17
Q

Tipos de BD

A

Primarias:
- información directa de fuentes como genes, proteínas, estructura…
- Gene Bank

Secundarias:
- derivadas del análisis de las primarias
- RefSeq (en GeneBank): secuencia de referencia de una proteína específica

18
Q

Curación es:

A

Proceso de colectar, inspeccionar, anotar y validar información de BD

19
Q

Elementos de una BD:

A

Tablas:
- Registros (filas)
- Campos (columnas)

Primary key:
campo que identifica de manera única cada registro en una tabla

Foreign key:
campo que está relacionado con la primary key. Establece relaciones entre tablas.

Índices

Entrada (entry):
es una fila

20
Q

Contenido de una entrada de una secuencia biológica

A

número de acceso (identificador único)
secuencia
descripción
datos taxonómicos
referencias cruzadas

21
Q

Formatos de secuencias (todos son de texto plano):

A

FASTA (sencillo): .fst, .fasta, .ft, .fa, .txt

GenBank (detallado)

EMBL (detallado)

Fastq (detallado)

22
Q

Una anotación es:

A

Metadato vinculado a una entrada en la base de datos

23
Q

Pipeline es:

A

Procesamiento secuencial de un conjunto de datos

24
Q

Gene ontology es una BD, se caracteriza por:

A

sistema de unificación de la representación de los genes (anotar y distribuir genes)

herramienta de fácil acceso

25
Q

Elementos de una tabla

A

ID (identificador):
- se asigna a cada registro/entry/fila
- puede ser la primary key

MapID:
- identificador relacionado a una asociación de
BDs

NRID:
- identificador nacional
- rastrea entidades dentro de un sistema más grande

26
Q
A