- Conocer, caracterizar y clasificar la totalidad de genes contenido en el genoma humano - Determinar la secuencia de 3,000 millones de nucleótidos - Organiza y almacena la info en bases de datos - Desarrolla tecnologías y herramientas para secuenciar más rápido

Proyecto del genoma humano Flashcards by Diego Verduzco

Características de los inicios del proyecto del genoma humano

de 1990 - 2003
Proyecto multinacional
Resultados publicados en Nature y Science
Se secuenció 5% del genoma y fue de la Drosophila melanogaster

95% era NO codificante

How well did you know this?

Not at all

Perfectly

En qué especies se llevó a cabo

C. elegans
Drosophila
Mus musculus (ratón)
Homo sapiens (humano)

How well did you know this?

Not at all

Perfectly

¿Qué fue el Proyecto Genoma Humano?

Su objetivo principal era determinar la secuencia completa de pares de bases químicas que componen el ADN e identificar y cartografiar todos los genes del genoma humano.

How well did you know this?

Not at all

Perfectly

Objetivos del HGP

Conocer, caracterizar y clasificar la totalidad de genes contenido en el genoma humano
Determinar la secuencia de 3,000 millones de nucleótidos
Organiza y almacena la info en bases de datos
Desarrolla tecnologías y herramientas para secuenciar más rápido

How well did you know this?

Not at all

Perfectly

¿Por qué se uso la Drosophila?

tiempo de desarrollo (10 años)
tamaño pequeño → gran # de individuos
mantenimiento de bajo costo

How well did you know this?

Not at all

Perfectly

¿Qué organismo modelo fue ampliamente utilizado para la clonación de fragmentos grandes de ADN en el Proyecto del Genoma Humano?

Escherichia coli (bacteria) -> los fragmentos grandes del genoma se clonaron en BACs, que luego se introdujeron en E. coli para replicación y mantenimiento
Nota: Drosophila se utilizó en estudios genéticos básicos, su papel NO estuvo en la clonación

How well did you know this?

Not at all

Perfectly

Se utilizó como organismo de estudio de la genética

La mosca de la fruta (Drosophila melanogaster)

How well did you know this?

Not at all

Perfectly

¿Cómo fueron las muestras biológicas del proyecto?

fueron de donadores (21)
muestras de sangre y semen
Se hicieron clonas de los fragmentos y con base en la calidad del material genético se tomaron las mejores

How well did you know this?

Not at all

Perfectly

¿Qué es una librería?

es una colección de fragmentos de ADN clonados
-> permiten almacenar y conservar fragmentos de ADN a largo plazo.

How well did you know this?

Not at all

Perfectly

Biblioteca BACs caract

Permitieron fragmentar el genoma en segmentos más manejables
Los BACs se amplificaron en bacterias, lo que permitió obtener grandes cantidades de ADN de cada fragmento del genoma.
Capaces de transportar fragmentos de ADN mucho más grandes que otros vectores, lo que los hace ideales para clonar grandes segmentos del genoma humano

How well did you know this?

Not at all

Perfectly

Colección de fragmentos de ADN clonado en un tipo particular de vector bacteriano llamado___

BAC -> puede almacenar fragmentos de ADN de hasta 300.000 pb, lo que permite cubrir grandes regiones del genoma.
-> Metodología de BAC-based clone by clone

How well did you know this?

Not at all

Perfectly

Unión de los fragmentos superpuestos

Ensamblaje

How well did you know this?

Not at all

Perfectly

Cómo fue la Clonación de Fragmentos de ADN en el HGP

Se crearon bibliotecas genómicas utilizando vectores como los BACs para clonar grandes fragmentos del genoma humano
Los fragmentos clonados se amplificaron en bacterias para obtener suficiente material para su secuenciación.

How well did you know this?

Not at all

Perfectly

Después de tenerlo en bibliotecas en bacterias

Después de tener los fragmentos clonados en bacterias en el HGP que seguía?

Los fragmentos de ADN clonados se secuenciaron de forma individual y luego se ensamblaron para obtener la secuencia completa del genoma.
-> Técnica de Sanger ABI PRISM 3700 ADN Analyzer

How well did you know this?

Not at all

Perfectly

¿Qué pasa con los errores no identificados en la secuenciación del HGP?

Podrían reducir la efectividad del ensamblaje

How well did you know this?

Not at all

Perfectly

Cobertura alta vs baja

Una cobertura alta indica que cada base del genoma ha sido leída muchas veces, lo que aumenta la confianza en la precisión de los datos y permite detectar variantes genéticas raras.
- Si la cobertura es baja, significa que muchas partes del genoma no se han leído

Profundidad

-Se refiere a cuántas veces se ha secuenciado una región específica del genoma.
Se refiere al número de veces o repeticiones que ha sido secuenciado una base del genoma
-Es decir, si nos enfocamos en un gen concreto, la profundidad nos indica cuántas veces hemos leído ese gen en particular.

cuántas copias tengo del mismo fragmento

¿Por qué los sobrelapes eran tan importantes en el HGP?
-> son secuencias de ADN que aparecen en dos fragmentos diferentes.

Era como un sistema de doble comprobación
Los sobrelapes permitían ensamblar los fragmentos de ADN en el orden correcto
Ayudaban a identificar y corregir errores
Al comparar las secuencias que se solapaban, los científicos podían verificar si la secuencia de cada fragmento era correcta
Si las partes que se superponían no coincidían, significaba que había un error en la secuenciación y se debía volver a verificar.

¿Cómo era el control de calidad del HGP?

-longitud de secuencia promedio de 543pb
-especificidad del 99.5%
-verificación de contaminación con E. Coli o ADN mitocondrial (asegurarse que solo queremos ADN genómico)

¿Cómo fue la estrategia y caracterización del ensamblaje del genoma?

2 conjuntos

dos conjuntos de datos:
celera genomics (fondos privados) uso estrategia escopeta a gran escala
-> 27.27 millones de lecturas, 543 pares de bases por lectura de 16 librerías
HGP fondos públicos
-> derivado de librerías BAC

¿Cómo fue el ensamblaje del genoma humano?

Compara fragmentos de librerías y debían sobrelaparse por lo menos 40pb y no debían tener + de 6% de diferencia entre ellas

Por qué los criterios de al menos 40pb y <6%

-Aseguraba que los fragmentos de ADN que se estaban comparando pertenecían a regiones adyacentes del genoma.
- 6% -> Garantizaba que los fragmentos que se estaban ensamblando provenían de la misma región genómica y no de regiones distintas con secuencias similares por casualidad.

¿Cómo fue la predicción de genes?

Pensaban que habían 30,000-40,000 en todo el cuerpo, sin embargo, se encontraron 100,000 tan solo en el cerebro

Los cálculos en qué estaban basados

(2)

En marcadores de secuencia expresada (EST) marcadores donde sabes que se expresa algo, nos permite identificar nuevos genes
Islas CpG (región promotora)

Importancia de identificar islas CpG

Al buscar islas CpG no metiladas en regiones upstream de los genes identificados por ESTs, podemos predecir la ubicación de los promotores -> y esa área tiene mayor actividad transcripcional

¿Qué es el mapeo citogenético?

- Marcar bandas C y G en los cromosomas con giemsa en el centrómero, telómeros, etc. para visualizar y analizar los cromosomas de una célula. - Identifica las pb -> mapeo físico | a nivel global

¿Qué es un mapeo de ligamiento?

Está relacionado con la **recombinación** -> nos permite determinar qué tan cerca están dos genes o marcadores genéticos en un cromosoma. - Se genera un mapa físico (como gen1 le sigue al gen2)

¿Cuál es el cromosoma que tiene más elementos repetidos?

El cromosoma 19 (57%) El 35% del genoma contiene elementos repetitivos

¿Qué son las islas CpG?

regiones ADN no metilado gran cantidad C y G hay entre 30,000-45,000 genes

¿Dónde se concentran las regiones no codificantes y codificantes en el cromosoma?

codificantes: regiones subtelomericas no codificantes: heterocromáticas y centroméricas

Porcentajes del genoma humano con respecto a sus secuencias

95% del genoma es no codificante 70% del genoma son copias únicas 30-40% son secuencias altamente repetitivas