1. El paisaje del genoma humano Flashcards
El genoma humano tiene ___ pares de bases.
3,2 mil millones
La media del % de G y C en el genoma es de:
42% (30-60% dependiendo de la zona)
Las regiones ricas en GC tienen (muchos / pocos) genes.
muchos
Qué porcentaje del genoma corresponde a regiones codificantes de genes? Cuántos genes codifican proteínas?
1,5-2%
20.000
Isocoro (definición)
Poblaciones de ventanas de estudio del genoma que podemos ver como bandas que se concentran por ultracentrifugación del DNA y se separan dependiendo de la cantidad de GC que contienen
Cuáles son los isocoros?
L1 L2 H1 H2 H3
Qué isocoros tienen la mayor densidad de genes?
H2 y H3
A cuáles bandas corresponde el nombre “desierto de genes”?
L1, L2 y H1
Tipos de DNA repetitivo
Repeticiones en tándem: satélite (1, 2, 3, alfa, beta, gamma), minisatélite, microsatélite
Repeticiones dispersas: DNA-transposones, LTR-retrotransposones (transposones RNA), No-LTR-Retrotransposones
Repeticiones en tándem (definición)
Secuencias de DNA en las que se repite un patrón de uno o más nts y las repeticiones son directamente adyacentes entre sí
Satélite (definición)
Secuencias de varias kb en tamaño, ocupa seguido de 100 kb a varias Mb
Minisatélite (definición)
Secuencias de 6-25 nts, ocupan seguido de 100 bp a 20 kb
Microsatélite (definición)
Secuencias de 1-4 nts, ocupa menos de 150 bp
También llamados SSR (simple sequence repeats) o STR (short tandem repeats)
VNTR (variable number tandem repeats) (definición)
Un tipo de minisatélite
Repeticiones dispersas (definición)
Son secuencias de DNA que se repiten de modo disperso por el genoma, y que son capaces de saltar de localización.
Cómo se clasifican las repeticiones dispersas?
Según
- Número de copia
- Tamaño
- % GC
- Promotor (sí / no)
TSD (target site duplication) (definición)
Es una secuencia idéntica presente en los dos extremos del transposón. Es DNA genómico y es donde ocurre la inserción del elemento saltante
Tipos de DNA-transposones
DNA autónomo (2-3 kb): pueden hacer una copia de la enzima transposasa
DNA no-autónomo (80-3000 bp): carece del fragmento de la enzima transposasa
LTR (definición)
Secuencia de DNA idéntica presente en los dos extremos de retrotransposones
Existen unas ____ copias de retrovirus (RNA-transposones) en el genoma humano, constituyendo un _% de la secuencia del genoma.
450.000
8%
Mecanismo de generación de LTR-retrotransposones
Retrovirus infecta célula e insertan un RNA en el genoma, el cual se copiará en los núcleos de nuevas células.
Tipos de LTR-retrotransposones
HERV retroviral autónomo: codifica los elementos virales
HERV retroviral no autónomo: no codifica todos los elementos virales
Tipos de No-LTR-Retrotransposones
Retrotransposon autónomo: LINEs (long interspersed nuclear element)
Retrotransposón no autónomo: SINEs (short interspersed nuclear element) (Alu)
Hay unas ____ copias de No-LTR-Retrotransposones en el genoma humano, constituyendo un _% de la secuencia del genoma.
850.000; 21%
Cómo funcionan los Retrotransposones autónomos (No-LTR-Retrotransposones)
Codifican dos proteínas:
- ORF1: codifica una RNA-binding protein (RBP)
- ORF2: codifica una proteína endonucleasa/retrotranscriptasa
Sintetiza el RNA, va al núcleo y hace una inserción
Hay unas ____ copias de retrotransposones no autónomos (No-LTR-retrotransposones) en el genoma humano, constituyendo un _% de la secuencia del genoma.
1.500.000; 13%
Los elementos repetidos más activos son:
AluY, un tipo de SINE (No-LTR-Retrotransposon) Luego L1 (LINE), y SVA (SINE-VNTR-ALU)
AluY crea una nueva inserción en la línea germinal cada __ nacimientos, mientras que L1 y SVA lo hacen cada __ nacimientos.
20
100-200
Gen (definición)
Partícula de material genético que, junto con otras, se halla dispuesta en un orden fijo a lo largo de un cromosoma, y que determina aparición de los carácteres hereditarios en los seres vivos. Puede codificar proteínas o no.
Partes de un gen
Promotor
TSS (transcription start site)
Zona 5’ UTR (se transcribe pero no se traduce)
CDS (coding sequence): exones; contiene codón de inicio (AUG) y de terminación (UGA, UAG, UAA)
Zona 3’ UTR (se transcribe pero no se traduce)
Intrones
Transcriptoma (definición)
Todos los mRNA de la célula (sólo los genes que se expresan en esa célula)
Tamaños de las regiones UTR
3’ UTR: 700 bp
5’ UTR: 300 bp
Pseudogen (definición)
Tienen la misma estructura que un gen, pero no codifican nada
Tipos de pseudogenes
Non-processed: genes duplicados que han acumulado mutaciones desactivantes (pueden tener promotor o no, pero igual no se traducen)
Processed: copias de mRNA que se han vuelto a insertar en el genoma (no tienen promotor)
Se puede expresar un pseudogen?
Los no procesados no se expresan porque tienen tantas mutaciones que no codifican nada (aunque tengan promotor).
En los procesados, se pueden expresar sólo si se insertan cerca de un promotor (no tienen uno propio) o enhancer, pero el producto se degrada por el nonsense-mediated decay.
Proyecto encode (definición)
Proyecto para hacer un enorme catálogo de todo el DNA funcional
Qué diferencia los lncRNAs de los mRNAs?
Son más cortos Tienen menos (4) exones, y también menos intrones No son ricos en GC, su contenido es igual al resto del genoma
La expresión de ___ es muy restrictiva (específica de tejido).
lncRNAs
Mecanismos de acción de los lncRNAs
Sentido: se transcribe upstream del gen que codifica la proteína; su final se superimpone al inicio del gen de la proteína, por lo que este no se transcribe
Antisentido: el lncRNA es la secuencia antisentido, por lo que la polimerasa no transcribe el gen de la proteína
Intergénico: se trascribe demasiado upstream, dejando el inicio del gen demasiado lejos para se transcrito
Esponja: el lncRNA une los miRNAs que normalmente bloquearían la expresión de la proteína, permitiendo que se exprese la proteína
Protein coding genes have: Number: Size: # of exons: GC% # of transcripts: Expression level: Expression pattern: Repeats:
20.000 20-30 kb 7-8 53% 4 alternative transcripts Higher Non-specific SINE (Alu), LINE
lncRNA coding genes have: Number: Size: # of exons: GC% # of transcripts: Expression level: Expression pattern: Repeats:
18.000 10-15 kb 2-4 42% 2 alternative transcripts Lower Highly specific ERV
Desequilibrio de ligamiento (LD) (definición)
Dos SNPs con alto desequilibrio se encuentran presentes en el mismo individuo (haplotipo de SNPs) más frecuentemente de lo que en teoría debería verse
Copy number variant (CNV)
Cambios en el número total de copias genómicas en grandes partes del genoma
La existencia de los CNV puede causar que tengamos 0 copias de un gen. Cómo es posible que esto ocurra y que sigamos vivos?
- Se ha eliminado un gen redundante, para el que existen otros sistemas que compensen su ausencia.
- Se ha eliminado un gen que TODAVÍA no ha causado enfermedad, pero que a lo mejor más adelante en la vida de la persona sí será un problema.
Segmental duplications (definición)
Duplicaciones de grandes regiones que pueden ser intracromosómicas o intercromosómicas
Base molecular del síndrome de DiGeorge
Microdeleción en el cromosoma 22 causada por recombinación no alélica por duplicaciones segmentales en ese cromosoma
Base molecular de la hemofilia A
Inversión en Xq28
Enfermedades asociadas a alteraciones en la región PMP22 del cromosoma 17
CMT1A (Charcot-Marie-Tooth): duplicación
HNPP (Neuropatía hereditaria con susceptibilidad a la parálisis por presión): deleción
SMS (Smith-Magenis): deleción
Qué tipos de repeticiones se usa en estudios forenses?
Microsatélites
Cómo se usan los elementos repetitivos en aplicaciones forenses?
Se digiere el DNA y se usan sondas para el DNA repetitivo. Para cada individuo se obtienen muchas bandas, pero el patrón es diferente según el individuo. (antiguo)
Se analizan los microsatélites con PCR y luego se pasan a un gel de electroforesis, en el que aparecen distintas bandas dependiendo del número de repeticiones en ese microsatélite (el número es polimórfico). Se usan 20 marcadores para que la probabilidad de tener dos personas con el mismo patrón sea muy bajo.