Proyecto del genoma humano Flashcards
Características de los inicios del proyecto del genoma humano
- de 1990 - 2003
- Proyecto multinacional
- Resultados publicados en Nature y Science
- Se secuenció 5% del genoma y fue de la Drosophila melanogaster
95% era NO codificante
En qué especies se llevó a cabo
C. elegans
Drosophila
Mus musculus (ratón)
Homo sapiens (humano)
¿Qué fue el Proyecto Genoma Humano?
Su objetivo principal era determinar la secuencia completa de pares de bases químicas que componen el ADN e identificar y cartografiar todos los genes del genoma humano.
Objetivos del HGP
- Conocer, caracterizar y clasificar la totalidad de genes contenido en el genoma humano
- Determinar la secuencia de 3,000 millones de nucleótidos
- Organiza y almacena la info en bases de datos
- Desarrolla tecnologías y herramientas para secuenciar más rápido
¿Por qué se uso la Drosophila?
tiempo de desarrollo (10 años)
tamaño pequeño → gran # de individuos
mantenimiento de bajo costo
¿Qué organismo modelo fue ampliamente utilizado para la clonación de fragmentos grandes de ADN en el Proyecto del Genoma Humano?
Escherichia coli (bacteria) -> los fragmentos grandes del genoma se clonaron en BACs, que luego se introdujeron en E. coli para replicación y mantenimiento
Nota: Drosophila se utilizó en estudios genéticos básicos, su papel NO estuvo en la clonación
Se utilizó como organismo de estudio de la genética
La mosca de la fruta (Drosophila melanogaster)
¿Cómo fueron las muestras biológicas del proyecto?
- fueron de donadores (21)
- muestras de sangre y semen
- Se hicieron clonas de los fragmentos y con base en la calidad del material genético se tomaron las mejores
¿Qué es una librería?
es una colección de fragmentos de ADN clonados
-> permiten almacenar y conservar fragmentos de ADN a largo plazo.
Biblioteca BACs caract
- Permitieron fragmentar el genoma en segmentos más manejables
- Los BACs se amplificaron en bacterias, lo que permitió obtener grandes cantidades de ADN de cada fragmento del genoma.
- Capaces de transportar fragmentos de ADN mucho más grandes que otros vectores, lo que los hace ideales para clonar grandes segmentos del genoma humano
Colección de fragmentos de ADN clonado en un tipo particular de vector bacteriano llamado___
BAC -> puede almacenar fragmentos de ADN de hasta 300.000 pb, lo que permite cubrir grandes regiones del genoma.
-> Metodología de BAC-based clone by clone
Unión de los fragmentos superpuestos
Ensamblaje
Cómo fue la Clonación de Fragmentos de ADN en el HGP
- Se crearon bibliotecas genómicas utilizando vectores como los BACs para clonar grandes fragmentos del genoma humano
- Los fragmentos clonados se amplificaron en bacterias para obtener suficiente material para su secuenciación.
Después de tenerlo en bibliotecas en bacterias
Después de tener los fragmentos clonados en bacterias en el HGP que seguía?
Los fragmentos de ADN clonados se secuenciaron de forma individual y luego se ensamblaron para obtener la secuencia completa del genoma.
-> Técnica de Sanger ABI PRISM 3700 ADN Analyzer
¿Qué pasa con los errores no identificados en la secuenciación del HGP?
Podrían reducir la efectividad del ensamblaje
Cobertura alta vs baja
Una cobertura alta indica que cada base del genoma ha sido leída muchas veces, lo que aumenta la confianza en la precisión de los datos y permite detectar variantes genéticas raras.
- Si la cobertura es baja, significa que muchas partes del genoma no se han leído
Profundidad
-Se refiere a cuántas veces se ha secuenciado una región específica del genoma.
Se refiere al número de veces o repeticiones que ha sido secuenciado una base del genoma
-Es decir, si nos enfocamos en un gen concreto, la profundidad nos indica cuántas veces hemos leído ese gen en particular.
cuántas copias tengo del mismo fragmento
¿Por qué los sobrelapes eran tan importantes en el HGP?
-> son secuencias de ADN que aparecen en dos fragmentos diferentes.
- Era como un sistema de doble comprobación
- Los sobrelapes permitían ensamblar los fragmentos de ADN en el orden correcto
- Ayudaban a identificar y corregir errores
- Al comparar las secuencias que se solapaban, los científicos podían verificar si la secuencia de cada fragmento era correcta
- Si las partes que se superponían no coincidían, significaba que había un error en la secuenciación y se debía volver a verificar.
¿Cómo era el control de calidad del HGP?
-longitud de secuencia promedio de 543pb
-especificidad del 99.5%
-verificación de contaminación con E. Coli o ADN mitocondrial (asegurarse que solo queremos ADN genómico)
¿Cómo fue la estrategia y caracterización del ensamblaje del genoma?
2 conjuntos
dos conjuntos de datos:
celera genomics (fondos privados) uso estrategia escopeta a gran escala
-> 27.27 millones de lecturas, 543 pares de bases por lectura de 16 librerías
HGP fondos públicos
-> derivado de librerías BAC
¿Cómo fue el ensamblaje del genoma humano?
Compara fragmentos de librerías y debían sobrelaparse por lo menos 40pb y no debían tener + de 6% de diferencia entre ellas
Por qué los criterios de al menos 40pb y <6%
-Aseguraba que los fragmentos de ADN que se estaban comparando pertenecían a regiones adyacentes del genoma.
- 6% -> Garantizaba que los fragmentos que se estaban ensamblando provenían de la misma región genómica y no de regiones distintas con secuencias similares por casualidad.
¿Cómo fue la predicción de genes?
Pensaban que habían 30,000-40,000 en todo el cuerpo, sin embargo, se encontraron 100,000 tan solo en el cerebro
Los cálculos en qué estaban basados
(2)
- En marcadores de secuencia expresada (EST) marcadores donde sabes que se expresa algo, nos permite identificar nuevos genes
- Islas CpG (región promotora)
Importancia de identificar islas CpG
Al buscar islas CpG no metiladas en regiones upstream de los genes identificados por ESTs, podemos predecir la ubicación de los promotores -> y esa área tiene mayor actividad transcripcional
¿Qué es el mapeo citogenético?
- Marcar bandas C y G en los cromosomas con giemsa en el centrómero, telómeros, etc. para visualizar y analizar los cromosomas de una célula.
- Identifica las pb -> mapeo físico
a nivel global
¿Qué es un mapeo de ligamiento?
Está relacionado con la recombinación
-> nos permite determinar qué tan cerca están dos genes o marcadores genéticos en un cromosoma.
- Se genera un mapa físico (como gen1 le sigue al gen2)
¿Cuál es el cromosoma que tiene más elementos repetidos?
El cromosoma 19 (57%)
El 35% del genoma contiene elementos repetitivos
¿Qué son las islas CpG?
regiones ADN no metilado
gran cantidad C y G
hay entre 30,000-45,000 genes
¿Dónde se concentran las regiones no codificantes y codificantes en el cromosoma?
codificantes: regiones subtelomericas
no codificantes: heterocromáticas y centroméricas
Porcentajes del genoma humano con respecto a sus secuencias
95% del genoma es no codificante
70% del genoma son copias únicas
30-40% son secuencias altamente repetitivas