Elementos funcionales y repetidos del genoma Flashcards
¿Qué es la transcripción?
Paso de DNA a RNA
Proceso de la transcripción
La hebra antisentido o cebador es molde para la transcripción; por lo que el transcrito es una copia exacta de la hebra sentido DNA con excepción del Uracilo
Secuencia de ácidos nucleicos necesarios para la síntesis de un producto génico funcional
Gen
Partes principales del gen
- Secuencias codificantes (exones)
- Secuencias no codificantes (intrones)
Dirección del templado de ARN en la cual es transcrito el ADN; positivo, después del promotor
Dowstream o río abajo
Dirección contraria del templado del ARN; negativos
Upstream o río arriba
¿Cuáles son las secuecias reguladoras?
- Caja TATA
- Caja GC
- Islas CpG
- Caja CAAT
- Enhancers
Secuencias de T y A repetidas
(secuencias reguladoras)
Caja TATA
Elemento con secuencia GGGCCG, en genes sin caja TATA.
(secuencias reguladores)
Caja CG
Características de la caja GC
- En genes sin caja TATA
- Pueden estar en dirección 5’ a 3’ o viceversa
- Se unen a los FT: SP1, SP3 y SP4
¿Qué es un gen constitutivo?
Genes que realizan lo mismo en todas la células
Secuencias ricas en G y C que indican el inicio de la transcripción
(secuencias reguladores)
Islas CpG
Se localiza en la posición -80; pueden orientarse en cualquier dirección.
(secuencias reguladoras)
Caja CAAT
Algunos sitios de control, se encuentran muy lejos del sitio de transcripción.
(secuencias reguladoras)
Potenciadores distantes
Características de los Enhancers
- Regulación en cis
- 50 kb río arriba
- río abajo de algún intrón
- río abajo en último exón
- pueden ser específicos para cada cel.
Modificaciones transcripcionales
- Adición de la 5’ cap
- Adición de la cola Poli A
- Splicing
Características de la Adición de la 5’ Cap
- Protege al ARN de degradación enzimática
- Ayuda en el transporte del ARN a citoplasma
- Sitio de unión de factor proteico requerido para la traducción
Características de la adición de la cola poli A
- Se agregan adeninas (100-250)
- Protege de la degradación
- Facilita la eficiente traducción
¿Qué es el Splicing?
Eliminación de los intrones y la unión de exones
¿Cómo se le conoce al primer RNA sintetizado?
- Transcrito primario
- RNA heterogéneo (hnRNA)
- RNA precursor
Partes obligatorias del transcrito primario
- Región UTR
- 5’Cap
- intrones y exones
- cola de poliA
Secuencias nucleotidicas específicas en las uniones de exones e intrones que se identifican en el splicing
Splice Junctions
Características del splicing
- Es una unidad de transcripción formada por intrones y exones.
- Se pierden regiones intrónicas.
- Se fusionan los exones.
Secuencias consenso unión intrones y exones
- Sitio donador
- Sitio aceptor
- Sitio ramificado (branch)
Proceso de corte en el splincing
Ataque nucleofílico de la G de la adenina presente en sitio ramificado contra la G del extremo 5’
- Provoca el rompimiento de la unión intrón y exón
Mecanismo de producción de diferentes isoformas de proteínas transcritas por un solo gen.
Splicing alternativo
RNAm: transporte
El nucleo está separado del citoplasma por dos membranas; el transporte a través de poros nucleares de membrana.
El RNAm se mantiene asociado a proteínas heterogéneas nucleares (hnRNP)
¿Por qué está formado un poro nuclear?
Por un complejo de poro nuclear
RNA más abundante
RNA ribosomal
Tipos de RNA
- 18S
- 28S
- 5.8S
- 5S
RNAm 18S
Asociado a subunidad ribosomal menor (40S)
RNAm 28S
Asociado a subunidad mayor (60S)
RNAm 28S
Asociado a subunidad mayor (60S)
RNAm 5.8S
Asociado a subunidad mayor (60S)
RNAm 5S
Asociado a subunidad mayor (usa Pol II)
Regiones que se requieren para la unión de Pol I en la transcripción
- un elemento río arriba que -155 a -60
- el sitio de la transcripción abarca de -40 a +5
Inicia la transcripción
Polimerasa I
Iniciación de la polimerasa I
- se une factor de activación multimérica al elemento río arriba (compuesto por histonas)
- unión de un factor trimérico y de TBP al elemento central donde también interactúa con UAF.
Iniciación de la polimerasa I
- se une factor de activación multimérica al elemento río arriba (compuesto por histonas)
- unión de un factor trimérico y de TBP al elemento central donde también interactúa con UAF.
Cuando después de la síntesis (nucleolo), se forma el rRNA naciente
Maduración
¿Por qué son reconocidas las posiciones de corte?
Por el snoRNA
small nucleolar RNA
¿Dónde se realiza el ensablaje de las unidades completas de RNAr?
Se completa en el nucleolo y posteriormente se moviliza por el NPC
¿Dónde se realiza el ensablaje de las unidades completas de RNAr?
Se completa en el nucleolo y posteriormente se moviliza por el NPC
Es cuando la región promotora de los genes codifican la tRNA, y rRNA 5s se encuentran localizados en la región de transcrito
Transcripción del RNAr
- en la unión de Pol III
Sitios de union de la Pol III en transcripción de RNAr
tRNA - Caja A y B
5S-rRNA- Caja C
Pasos de la Maduración de RNAr
1- Eliminación del intron en splincing
2- Secuencias 5’ eliminada por RNAsa P
3- Residuo UU (3’) - es remplazado por ACC requerido durante la síntesis de proteínas
4- Distintas bases son modificadas en el proceso de Maduración
Funciones de los RNA no codificantes
- Contienen info genética
- Síntesis de proteínas
- Maduración del RNA
- Regulación de la expresión de genes
- RNA catalítico (ribozima —> splicing)
¿Cómo es la estructura del RNA no codificante?
Dependiendo de su función puede adquirir diferentes conformaciones
Tipos de estructuras del RNA no codificante
- Primarias
- Secundarias
- Terciarias
Estructuras secundarias del RNA no codificante
- Hairpins: 5 a 10 nt
- Stem-loops: hasta miles de nt
Estructuras secundarias del RNA no codificante
- Hairpins: 5 a 10 nt
- Stem-loops: hasta miles de nt
Estructura terciaria del RNA no codifiante
- Pseudoknot: 2 stem 2 loops
Tipos de RNA no codificantes
- RNA nucleares pequeños (snRNA)
- RNA nucleolares pequeños (snoRNA)
- RNA pequeños de Cajal (scaRNA)
- RNA de interferencia (iRNA)
- RNA largos no codificantes (IncRNA)
Funcion de los RNA nucleares pequeños (snRNA)
Maduración de RNA primario
Funcion de los RNA nucleolares pequeños (snoRNA)
Precursores de los rRNA
Función de los RNA pequeños de Cajal (scaRNA)
Modifican snRNA y snoRNA
Función de los RNA de interferencia (iRNA)
21-25 nt de RNA de doble cadena que causan el silenciamiento génico
Tipos de RNA de interferencia (iRNA)
RNA de interferencia pequeños (siRNA)
Micro RNA (miRNA)
RNA Piwi interactivos (piRNA)
Función de los RNA largos no codificantes (IncRNA)
De mas de 2000 nt.
- Sirven de armazón
- Regulan diversos procesos como de la actividad genética y heterocromatización del chr X
RNAs minoritarios
- snRNA
- miRNA
- siRNA
Proteínas de snRNA
U1, U2, U3, U4, U5 y U6
Características generales del snRNA
- Involucrado en el proceso de splicing pre-RNA
- Formado por 107-210 nt
- Presentes en el nucleo
- Asociados con 6 a 10 proteínas que forman el Small nuclear Ribonucleoprotein particles
¿Qué hace U1?
Se une al extremo 5’ del pre-RNA
¿Qué hace U2?
Se une al Branch Site o punto de ratificación del intrón 1
¿De qué forma parte el snRNA?
Forma parte del spliceosoma
Características generales de miRNA
- 21 a 22 nt
- Se conocen commo RNA pequeños
¿Qué hace miRNA?
- Regulan la transcripción por medio de complementariedad de bases de los transcriptos
- Hibridan con el mRNA, bloqueando la traducción
Formas de miRNA
Bicatenaria: Forma inactiva
Monocatenaria: Forma activa
Pasos de la síntesis de RNA
1- RNA pol II sintetiza el pre-miRNA
2- Drosha corta el pre-miRNA, y sale a citoplasma
3- Dicer corta el pre-miRNA a miRNA
4- Argonauta degrada una de las hebras del RNA
¿Qué hace DROSHA?
Quita la cola de poli A y la 5’ cap
¿Qué hace DICER?
Quita el loop
¿Qué hace Argonauta?
Quita una cadena
Formado por el RNA de cadena sencilla y múltiples proteínas
Complejo RISC
¿Qué hace siRNA?
Inhibe la traducción y promueve la degradación
Pasos de la síntesis de siRNA
- Es cortado por DROSHA: sale del nucleo
- DICER: corta para formar un RNA duplex
- Se une al complejo Arg-RISC
- Se une a la cadena blanco
- Realiza su función
¿Cuáles fueron los dos objetivos principales del proyecto Encode?
- Cataloga los elementos funcionales del genoma
- Investiga la regulación de la expresión génica y salud
Con el proyecto ENCODE se pretendía identificar:
- Genes codificantes de proteínas
- Genes que no codifican para proteínas
- Elementos reguladores de la transcripción
- Secuencias que median la estructura y dinámica cromosómica
¿De qué año a qué año fue la fase piloto del proyecto ENCODE?
2003 a 2007
Fase piloto del proyecto ENCODE
Evaluación de estrategias para la identificación de regiones del genoma
- Fase de desarrollo tecnológico
¿Qué se hizo en la fase piloto del proyecto ENCODE?
- Se eligieron 44 regiones para estudiar (1% del genoma)
- Identificación de regiones de DNA que transcriban a RNA
Metodología usada en el proyecto ENCODE
Hibridación ChIP-chip
¿Cómo funciona la Hibridación ChIP-chip?
- Inmunoprecipitación de cromatina
- Técnica que permite identificar los sitios de unión de las proteínas que se unen al ADN
¿Cuáles son las proteínas que se busca identificar en la inmunoprecipitación de cromatina?
- Factores de transcripción
- Histonas
- Reguladoras de la cromatina
¿Cómo se realizó el estudio para la identificación de la metodología de ENCODE?
- Analizan 10 organismos vertebrados, seleccionados por la posición filogenética
- Secuenciación de regiones ortólogas
- Con el fin de encontar elementos conservados a nivel evolutivo
- Desarrollar herramientas computacionales para las secuecnias comparativas e inferir funciones biológicas
¿Cómo se realizó el estudio para la identificación de la metodología de ENCODE?
- Analizan 10 organismos vertebrados, seleccionados por la posición filogenética
- Secuenciación de regiones ortólogas
- Con el fin de encontar elementos conservados a nivel evolutivo
- Desarrollar herramientas computacionales para las secuecnias comparativas e inferir funciones biológicas
¿De qué año a qué año fue la segunda fase del proyecto ENCODE?
2008 a 2012
Se publican 13 artículos en la revista Nature
Parte uno de la segunda fase del Proyecto ENCODE
- Motivos de Factores de Transcripción
¿Qué se hizo en la parte de los Motivos de factores de Transcripción en la fase 2 de ENCODE?
- Se mapearon 119 regiones en donde se observa la unión de proteínas a DNA
- Componentes de RNA pol en 72 tipos de cel
- 87 fueron secuencia específica de factores FT
FACTORBOOK: catálogo de sitios de unión a FT
Parte dos de la segunda fase del Proyecto ENCODE
Estudio de patrones de sitios de unión a factores de transcripción
¿Qué se realizo en el estudio de patrones de sitio de unión a factores de transcripción en la fase dos de ENCODE?
- Los sitios de unión a FT ayudan a explorar las propiedades de la cromatina
- Evalúan la unión de H3K27me3
(modificación epigenética en la histona H3, trimitelación de la lisina 27)
Parte tres de la segunda fase del Proyecto ENCODE
Caracterización de regiones intergénicas y definición de un gen
Parte cuatro de la segunda fase del Proyecto ENCODE
RNAs y patrones de modificación de cromatina al rededor de regiones promotoras
¿Qué se hizo en la parte cuatro de la fase dos del Proyecto ENCODE?
Realizan modelos de predicción que exploran la interacción entre modificaciones de histonas y promotores
Parte cinco de la segunda fase del Proyecto ENCODE
Regulación epigenética del procesamiento de RNA
¿Qué se encontró en la parte cinco de la fase dos del proyecto ENCODE?
Se encontraron dos tipos de promotores:
- Islas C-G, en menor cantidad
- Caja TATA
Parte seis de la segunda fase del Proyecto ENCODE
Caracterización de RNAs no codificantes
¿Qué se hizo en la sexta parte de la fase dos del proyecto ENCODE?
Se utilizó la técnica de Cage-seq para identificar sitios de inicio de la transcripción
- RNAs de menos de 200 nt han sido asociados
- Se identifica a la CAP
Parte siete de la segunda fase del Proyecto ENCODE
Metilación de DNA
¿Qué se hizo en la metilación de ADN del Proyecto ENCODE en fase dos?
- Descubrimiento y carcaterización de enhancers
- Impacto de la selección evolutiva en regiones funcionales
¿Qué son los repetidos comunes?
Regiones de DNA que contienen secuencias repetidas y dispersas
Tipos de repetidos comunes
- Transposones
- Regiones intergénicas
- Pseudogenes
- Rep. cortas
- Rep. largos
- Rep. en tándem
¿Qué son los transposones?
Elementos móviles del genoma: secuencias que se pueden replicar e isnertar en diferentes localizaciones
Transposones de clase I
Retrotransposones
¿Qué son los retrotansposones?
En los procesos de duplicación o desplazaiento son transcritos a RNA, se clasifican en:
- Regiones terminales largas (LTRs)
- Repeticiones terminales no largas (no TLR)
Repeticiones terminales largas (LTRs)
secuencias largas (100 a 5 kb) localizadas al extremo de los cromosomas
Repeticiones terminales o largas (no LTR)
- Elementos intercalados largos (LINEs)
20% del genoma - Elemenos intercalados no largos (SINEs)
13% del genoma
Repetidos comunes de Clase II
DNA transposones
Características de los LINES
- Localizados en regiones eucromáticas en las bandas G
- Autónomos: pueden hacer los productos para la transposición
- Contienen una transcriptasa reversa, P40 y una endonucleasa
Características de los SINES
- Retrotansposones de 100 a 400 pb
- no autónomos
- SINEs y LINEs comparten secuencias
Forma mas comun de los SINEs
Elemetos ALU
Elementos ALU
Secuencia mas abundante, con una longitud de 280 pb, compuesto por:
- Dos repetidos en tándem de 120 pb c/u, seguido de una secuencia An/Tn
¿Qué es un pseudogen?
Secuencias de DNA que tienen estructura parecida a un gen, pero no tiene la capacidad de producir una proteína
Características de los pseudogenes
- Se originaron por duplicaciones en tándem
- La perdida de capacidad de producir una proteína se da por acumulación de mutaciones
¿Qué han descubierto recientemente los estudios sobre pseudogenes?
Que los pseudogenes pueden tener hasta un 90% de concordancia con su gen funcional homólogo
¿Cómo es la concordancia entre los genes y los pseudogenes?
No es equitativa
¿Cómo se clasifican los pseudogenes?
Según el tipo de mecanismo de duplicación
Tipos de pseudogenes
- Nonprocessed pseudogene
- Processed pseudogen
- Unitary pseudogen
Nonprocessed Pseudogene
- Remanentes de genes duplicados en tándem
- Mantienen la estructura de intrones y exones
- Concordancia de secuencias pero poca funcionalidad
Processed Pseudogene
Se forman cuando se insertan secuencias derivadas de la retrotranscripción del RNAm
- Carecen de intrones
- Elementos reguladores
- Puede tener cola de poliA
Unitary pseudogen
- Genes que no tienen un gen parental, funcionan en el genoma (los genes funcionales del gen parental pueden estar en otras especies)
Posibles funciones de los pseudogenes
- Se cree que tienen el potencial de actuar como reguladores transcripcionales de gener funcionales al codificar miRNA
- Pueden transcribirse aunque no tengan la estructura completa: derivan en enfermedad
¿Qué es The GENCODE?
Un proyecto del consorcio del proyecto ENCODE que permitió anotar e identificar 12,000 pseudogenes
Pseudogenes tienen un rol en la respuesta inmune:
La hipótesis es que esta conversión genética ha generado una diversidad de anticuerpos
Pseudogenes y su relación con la variación genética
La bacteria Borellia genera diversidad genética mediante recombinación de un arreglo en tándem de un pseudogen en un sitio de expresión telomérica en un plásmido lineal
Funciones de los pseudogenes
- Se propone que actúan como miRNAs o siRNAs
- Pueden desarrollar funciones de regulación
- Generación de anticuerpos y antígenos
¿Cómo llevan a cabo la recombinación los pseudogenes?
- Llevan a cabo recombinación con genes funcionales
- Puede llevarse a cabo una conversión genética con genes funcionales derivando en enfermedades
¿Qué son las duplicaciones segmentales?
Tipo de mutación en donde se producen una o mas copias de un segmento de DNA
Tipos de duplicaciones segmentales
- Microduplicación
- Duplicación génica
- Duplicación cromosómica
Mecanismos de Duplicación
- Duplicación de gen en tándem
- Transposición duplicativa
- Duplicación por fusión celular ancestral
- Duplicaciones subgenómicas a gran escala
Duplicaciones en tándem
Se dan por entrecruzamiento de cromátidas alineadas de manera incorrecta, ya sea de cromátidas hermanas o en el mismo cromosoma
Unequal Crossover
Alineación incorrecta de cromátidas hermanas
Unequal sister chromatid exchange
Alineación incorrecta en un mismo cromosoma
Short tándem repeats
Secuencia de dos o más bases de DNA que se repiten varias veces en forma de cadena en un cromosoma
Características del Short Tándem Repeats
- Se presentan en el DNA no codificante
- Pueden servir como marcadores genéticos para rastrear la herencia en familia
Transposición duplicativa
Se presenta cuando el DNA se integra a otra localización cromosomal (retrotransposición)
Duplicación por fusión celular ancestral
Se cree que el origen de las cel. eucariotas fue a traves de la endocitosis de un tipo de bacteria por parte de un precursor de las cel. eucariotas
Duplicaciones segmentales subgenómicas a gran escala
- Surgen de translocaciones cromosómicas
- Regiones inestables
Regiones inestables de las duplicaciones subgenomicas a gran escala
Las regiones pericentroméricas y subteloméricas son propensas a recombinación con otros cromosomas
Características de las Low Copy Repeats
- Fragmentos de DNA de 1-300 kb
- Constituyen el 6.6% del genoma
- Se encuentran en regiones pericentroméricas, subteloméricas e intersticiales
Cromosomas que tienen una mayor cantidad de duplicaciones
Cromosoma 22 y Y
SDs
Desordenes genómicos son causados por alineamiento de segmentos con alta identidad
NAHR
Recombinación de regiones homólogas no alélicas
NAHR con deleciones y duplicaciones
- De cromátidas hermanas
- Intracromosomal
¿Cómo son las inversiones?
Se llevan a cabo mediante la orientación opuesta de los LCRs
- Pueden ser neutros - no generar un cambio (heterocromatina)
A menos que la inversión afecte un gen:
- Interrumpir el orden del gen
- Alterando la expresión del gen
Tipos de LCR
- Pericentroméricas
- Subteloméricas
- Intersticiales
LCR Pericentroméricas
Generado por eventos de duplicación intercromosomal
LCR Subteloméricas
Formados por múltiples eventos de rompimiento de doble cadena y reparaciones de la región subtelomérica formando bloques de secuencia
LCR Intersticiales
Enriquecidos por duplicaciones intracromosómicas
LCR que se recombinan entre diferentes cromosomas
Pericentroméricos y subteloméricas
LCR que se duplica en el mismo cromosoma
Intersticiales