Proyecto del genoma humano Flashcards

1
Q

Características de los inicios del proyecto del genoma humano

A
  • de 1990 - 2003
  • Proyecto multinacional
  • Resultados publicados en Nature y Science
  • Se secuenció 5% del genoma y fue de la Drosophila melanogaster

95% era NO codificante

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

En qué especies se llevó a cabo

A

C. elegans
Drosophila
Mus musculus (ratón)
Homo sapiens (humano)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

¿Qué fue el Proyecto Genoma Humano?

A

Su objetivo principal era determinar la secuencia completa de pares de bases químicas que componen el ADN e identificar y cartografiar todos los genes del genoma humano.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Objetivos del HGP

A
  • Conocer, caracterizar y clasificar la totalidad de genes contenido en el genoma humano
  • Determinar la secuencia de 3,000 millones de nucleótidos
  • Organiza y almacena la info en bases de datos
  • Desarrolla tecnologías y herramientas para secuenciar más rápido
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

¿Por qué se uso la Drosophila?

A

tiempo de desarrollo (10 años)
tamaño pequeño → gran # de individuos
mantenimiento de bajo costo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

¿Qué organismo modelo fue ampliamente utilizado para la clonación de fragmentos grandes de ADN en el Proyecto del Genoma Humano?

A

Escherichia coli (bacteria) -> los fragmentos grandes del genoma se clonaron en BACs, que luego se introdujeron en E. coli para replicación y mantenimiento
Nota: Drosophila se utilizó en estudios genéticos básicos, su papel NO estuvo en la clonación

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Se utilizó como organismo de estudio de la genética

A

La mosca de la fruta (Drosophila melanogaster)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

¿Cómo fueron las muestras biológicas del proyecto?

A
  • fueron de donadores (21)
  • muestras de sangre y semen
  • Se hicieron clonas de los fragmentos y con base en la calidad del material genético se tomaron las mejores
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

¿Qué es una librería?

A

es una colección de fragmentos de ADN clonados
-> permiten almacenar y conservar fragmentos de ADN a largo plazo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Biblioteca BACs caract

A
  • Permitieron fragmentar el genoma en segmentos más manejables
  • Los BACs se amplificaron en bacterias, lo que permitió obtener grandes cantidades de ADN de cada fragmento del genoma.
  • Capaces de transportar fragmentos de ADN mucho más grandes que otros vectores, lo que los hace ideales para clonar grandes segmentos del genoma humano
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Colección de fragmentos de ADN clonado en un tipo particular de vector bacteriano llamado___

A

BAC -> puede almacenar fragmentos de ADN de hasta 300.000 pb, lo que permite cubrir grandes regiones del genoma.
-> Metodología de BAC-based clone by clone

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Unión de los fragmentos superpuestos

A

Ensamblaje

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Cómo fue la Clonación de Fragmentos de ADN en el HGP

A
  • Se crearon bibliotecas genómicas utilizando vectores como los BACs para clonar grandes fragmentos del genoma humano
  • Los fragmentos clonados se amplificaron en bacterias para obtener suficiente material para su secuenciación.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Después de tenerlo en bibliotecas en bacterias

Después de tener los fragmentos clonados en bacterias en el HGP que seguía?

A

Los fragmentos de ADN clonados se secuenciaron de forma individual y luego se ensamblaron para obtener la secuencia completa del genoma.
-> Técnica de Sanger ABI PRISM 3700 ADN Analyzer

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

¿Qué pasa con los errores no identificados en la secuenciación del HGP?

A

Podrían reducir la efectividad del ensamblaje

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Cobertura alta vs baja

A

Una cobertura alta indica que cada base del genoma ha sido leída muchas veces, lo que aumenta la confianza en la precisión de los datos y permite detectar variantes genéticas raras.
- Si la cobertura es baja, significa que muchas partes del genoma no se han leído

17
Q

Profundidad

A

-Se refiere a cuántas veces se ha secuenciado una región específica del genoma.
Se refiere al número de veces o repeticiones que ha sido secuenciado una base del genoma
-Es decir, si nos enfocamos en un gen concreto, la profundidad nos indica cuántas veces hemos leído ese gen en particular.

cuántas copias tengo del mismo fragmento

18
Q

¿Por qué los sobrelapes eran tan importantes en el HGP?
-> son secuencias de ADN que aparecen en dos fragmentos diferentes.

A
  • Era como un sistema de doble comprobación
  • Los sobrelapes permitían ensamblar los fragmentos de ADN en el orden correcto
  • Ayudaban a identificar y corregir errores
  • Al comparar las secuencias que se solapaban, los científicos podían verificar si la secuencia de cada fragmento era correcta
  • Si las partes que se superponían no coincidían, significaba que había un error en la secuenciación y se debía volver a verificar.
19
Q

¿Cómo era el control de calidad del HGP?

A

-longitud de secuencia promedio de 543pb
-especificidad del 99.5%
-verificación de contaminación con E. Coli o ADN mitocondrial (asegurarse que solo queremos ADN genómico)

20
Q

¿Cómo fue la estrategia y caracterización del ensamblaje del genoma?

2 conjuntos

A

dos conjuntos de datos:
celera genomics (fondos privados) uso estrategia escopeta a gran escala
-> 27.27 millones de lecturas, 543 pares de bases por lectura de 16 librerías
HGP fondos públicos
-> derivado de librerías BAC

21
Q

¿Cómo fue el ensamblaje del genoma humano?

A

Compara fragmentos de librerías y debían sobrelaparse por lo menos 40pb y no debían tener + de 6% de diferencia entre ellas

22
Q

Por qué los criterios de al menos 40pb y <6%

A

-Aseguraba que los fragmentos de ADN que se estaban comparando pertenecían a regiones adyacentes del genoma.
- 6% -> Garantizaba que los fragmentos que se estaban ensamblando provenían de la misma región genómica y no de regiones distintas con secuencias similares por casualidad.

23
Q

¿Cómo fue la predicción de genes?

A

Pensaban que habían 30,000-40,000 en todo el cuerpo, sin embargo, se encontraron 100,000 tan solo en el cerebro

24
Q

Los cálculos en qué estaban basados

(2)

A
  • En marcadores de secuencia expresada (EST) marcadores donde sabes que se expresa algo, nos permite identificar nuevos genes
  • Islas CpG (región promotora)
25
Q

Importancia de identificar islas CpG

A

Al buscar islas CpG no metiladas en regiones upstream de los genes identificados por ESTs, podemos predecir la ubicación de los promotores -> y esa área tiene mayor actividad transcripcional

26
Q

¿Qué es el mapeo citogenético?

A
  • Marcar bandas C y G en los cromosomas con giemsa en el centrómero, telómeros, etc. para visualizar y analizar los cromosomas de una célula.
  • Identifica las pb -> mapeo físico

a nivel global

27
Q

¿Qué es un mapeo de ligamiento?

A

Está relacionado con la recombinación
-> nos permite determinar qué tan cerca están dos genes o marcadores genéticos en un cromosoma.
- Se genera un mapa físico (como gen1 le sigue al gen2)

28
Q

¿Cuál es el cromosoma que tiene más elementos repetidos?

A

El cromosoma 19 (57%)
El 35% del genoma contiene elementos repetitivos

29
Q

¿Qué son las islas CpG?

A

regiones ADN no metilado
gran cantidad C y G
hay entre 30,000-45,000 genes

30
Q

¿Dónde se concentran las regiones no codificantes y codificantes en el cromosoma?

A

codificantes: regiones subtelomericas
no codificantes: heterocromáticas y centroméricas

31
Q

Porcentajes del genoma humano con respecto a sus secuencias

A

95% del genoma es no codificante
70% del genoma son copias únicas
30-40% son secuencias altamente repetitivas