A5 TÉCNICAS DE PATOLOGÍA MOLECULAR Flashcards
Proceso de DNA a RNA
Transcripción
Proceso RNA a proteína
Translation - traducción
Porcentaje DNA transcrito y porcentaje DNA que codifica para proteínas
70%
Sólo el 2%
Clases de ncRNA
miRNA
circularRNA
IncRNA
Primeros miRNA descritos
Lin-4: primero descrito, función en nematodos
Let-7: segundo descrito: papel en regulación del desarrollo tardío y diferenciación celular. Conservado en diversos organismos, incluidos los humanos. Implicación en cáncer. Supresor de tumores en humanos.
Función general miRNA
Los miARNs son pequeños ARN no codificantes (aproximadamente 22 nucleótidos de longitud) que regulan la expresión génica post-transcripcionalmente. Lo hacen uniéndose a regiones específicas del ARN mensajero (ARNm) y promoviendo su degradación o bloqueando su traducción a proteínas.
miR-155 over-expression is prognostic in…
lung cancer
“patients with…high hsa-mir-155…had poorer survival than the patients with low hsa-miR-155.”
MicroRNAs can be oncogenes or tumor suppressors?
MicroRNAs can be oncogenes and tumor suppressors
Technologies for detecting miRNAs
- Northern blot
- In situ hybridization
- qRT-PCR
- Microarray/hybridization
- Low density qRT-PCR arrays
- miRNA-seq
El flujo básico de un experimento de proteómica consiste en:
o Obtención de la muestra biológica.
o Extracción de las proteínas.
o Digestión enzimática de las proteínas en péptidos.
o Separación de los péptidos por HPLC (cromatografía líquida).
o Espectrometría de masas, para detectar la masa de cada péptido, lo que permite
identificar la secuencia del péptido.
o Análisis de los datos.
El proteoma es la totalidad de proteínas expresadas en una célula, que varía
dinámicamente en función de cuatro niveles regulatorios:
abundancia de proteínas,
modificaciones post-traduccionales, interacciones entre proteínas y localización subcelular.
Para la preparación de la muestra para estudio proteómico, ¿qué enzima se utiliza para la digestión enzimática?
Tripsina
¿Qué es la cromatografía líquida?
El proceso cromatográfico separa péptidos en una columna con matriz y solvente según su afinidad por la fase móvil o estacionaria. Sin embargo, la alta abundancia de ciertas proteínas, como la albúmina en plasma (más del 50%), puede dificultar el análisis. Para resolverlo, se usa electroforesis para identificar y eliminar proteínas abundantes, dejando el resto para el experimento. Esto evita interferencias y mejora la detección de péptidos menos representados en la muestra.
que es un espectrómetro de masas en proteómica
Un espectrómetro de masas en proteómica identifica y caracteriza proteínas analizando iones según su relación masa/carga (m/z). Sus componentes principales incluyen:
- Fuente de ionización (ESI o MALDI): Convierte proteínas o péptidos en iones.
- Sistema de vacío: Garantiza un ambiente sin colisiones indeseadas.
- Analizador de masas (TOF, Orbitrap, cuadrupolo): Separa iones según su m/z.
- Célula de colisión: Fragmenta iones seleccionados para análisis estructural.
- Detector: Registra los iones y genera datos.
- Software: Procesa datos y compara espectros con bases de datos.
Es esencial para identificar proteínas, estudiar secuencias y cuantificar niveles en estudios biológicos.
Determinación del punto de corte para un marcador: deben tenerse en cuenta los criterios de
sensibilidad, especificidad y área bajo la curva.
Censura por la derecha
el evento no ha sucedido en el tiempo de estudio (ejemplo, aparición de metástasis en los dos años posteriores al tratamiento). No significa que no vaya a suceder el evento, pero no ha sucedido durante el tiempo de estudio.
censura independiente
(por la finalización del estudio o la pérdida del
seguimiento)
censura dependiente
(pérdida de seguimiento relacionada con el suceso, como por ejemplo la progresión de la enfermedad, el abandono del tratamiento por los efectos secundarios o los riesgos competitivos).
Curvas de Kaplan-Meier:
estimación no paramétrica de la supervivencia de los individuos de un estudio.
Sería el equivalente a la frecuencia observada de individuos vivos en cada momento pero teniendo en cuenta apropiadamente los datos censurados.
Modelo de Cox o riesgos proporcionales:
probabilidad de que a un individuo que ha sobrevivido hasta el tiempo t, le ocurra el evento de interés en el próximo instante.
El análisis de la supervivencia permite analizar el tiempo T hasta un determinado evento de interés. Deben definirse muy claramente:
El tiempo cero al inicio del estudio, T0: diagnóstico,intervención, inicio de tratamiento, randomización, etc.
El suceso de interés, E: muerte, recurrencia, rechazo, etc.
Entonces, el tiempo de supervivencia T es el tiempotranscurrido entre T0 y el momento en que se produce E.
Validación aparente
Se analiza el comportamiento del modelo sobre los mismos datos que se han utilizado para generarlo.
Validación interna:
Se analiza el comportamiento del modelo sobre una muestra de la misma población que los datos que se han utilizado para generar el modelo.
Validación externa:
El objetivo es analizar la generalización del modelo a poblaciones similares a la que ha servido para generar el modelo. Se analiza el comportamiento del modelo sobre una o varias muestras independientes a la muestra utilizada para generar el modelo.
El balance final de la interacción entre las células neoplásicas y el sistema inmune depende de un escenario complejo donde computan:
- Carga mutacional del tumor
- Generación de neoantígenos
- Expresión de moléculas implicadas en el MHC-I y MHC-II
- Células T reguladoras
- Células T citotóxicas
- Presencia y balance de macrófagos pro-inflamatorios/Macrófagos reguladores
- Actividad TFG-beta en el microambiente
- Tratamientos previos
- Índice proliferativo del tumor
- Modelado del sistema inmune a través de la flora intestinal
Tumores con alta afinidad a terapia dirigida contra el checkpoint immune son:
- Tumores con alta carga mutacional
- Tumores con amplificación de la región cromosómica 9p24
- Tumores que expresan antígenos virales
- En general, tumores cálidos, tumores con alto contenido de células inflamatorias.
marcadores potenciales de sensibilidad/resistencia a terapia dirigida contra el checkpoint immune son:
• Mutaciones con pérdida de función de JAK1 o JAK2
• pérdida de expresión de Beta-2-microglobulina
• Alteraciones en MDM2/MDM4 y EGFR
• Mutaciones de P53
• Pérdida de expresión de PTEN
• Expresión aberrante de PD-L1 debida a disrupción de 3-UTR
• Mutaciones con pérdida de función en el receptor de Apelina (interactuando on JAK1)
Para estudiar el orden exacto o secuencia del ADN de una persona, fundamentalmente son necesarios tres pasos:
1) aislar y purificar el ADN de un tejido o de células, 2) amplificar el ADN o las secuencias de interés con unos cebadores específicos, y 3) leer la secuencia y compararla con otras.
Mutación puntual:
es una ganancia, pérdida o cambio de un único par de bases. Aunque la mayoría de las mutaciones puntuales son benignas, también pueden tener diversas consecuencias funcionales, como cambios en la expresión génica o alteraciones en las proteínas codificadas.
Deleción:
es un tipo de mutación que implica la pérdida de uno o más nucleótidos de un segmento de
ADN, desde un solo nucleótido hasta un fragmento cromosómico.
Mutación frameshift o con cambio del marco de lectura:
es una inserción o deleción de bases nucleotídicas en números que no son múltiplos de tres. Si una mutación altera el marco de lectura normal, toda la secuencia genética que sigue a la mutación se leerá incorrectamente. Esto puede dar lugar a la incorporación de aminoácidos erróneos a la proteína y/o a la creación de un codón stop prematuro.
Inserción:
es un tipo de mutación que implica la ganancia de uno o más nucleótidos en un segmento de
ADN, desde un solo nucleótido hasta un fragmento cromosómico.
Polimorfismo:
es una variante genómica, es decir, dos o más patrones de una secuencia específica de ADN que varían entre individuos o poblaciones. El tipo más común de polimorfismo es la variación de un solo nucleótido o single nucleotide polymorphism (SNP). Otros polimorfismos pueden afectar segmentos más largos de ADN.
Variante estructural (SV, structural variant):
variante en la estructura cromosómica que afecta una longitud de secuencia de entre 50bp a 3Mbp. Las SVs incluyen deleciones, duplicaciones, variantes en el número de copias, inserciones, inversiones y translocaciones, algunas de las cuales se asocian a enfermedades genéticas. Sin embargo, la mayoría de las SVs son polimorfismos, es decir, variantes que determinan la variabilidad genómica entre individuos y poblaciones.
Reacción en cadena de la polimerasa (Polymerase Chain Reaction, PCR):
Su objetivo es obtener un gran número de copias de un fragmento concreto de ADN partiendo de un mínimo; en teoría basta con partir de una única copia de ese fragmento original o molde.
Secuenciación Sanger (método de terminación de cadena):
incorporación aleatoria por una enzima ADN polimerasa de dideoxinucleótidos (ddNTP) de terminación de cadena durante la replicación in vitro del ADN. Los dideoxinucleótidos de terminación de cadena carecen de un grupo 3’-OH necesario para la formación de un enlace fosfodiéster entre dos nucleótidos, lo que hace que la ADN polimerasa cese la extensión del ADN cuando se incorpora un ddNTP modificado.
Secuenciación de nueva generación o Next-Generation Ssequencing (NGS):
(NGS): tecnología de secuenciación masiva en paralelo del ADN que permite analizar el genoma completo, los exones de todos los genes conocidos (exoma completo) o sólo los exones de genes seleccionados (panel de genes). La NGS de ADN implica la fragmentación del ADN, preparación de librerías (exoma, genoma, paneles), secuenciación paralela masiva, un análisis bioinformático y la anotación e interpretación de variantes/mutaciones.
Secuenciación del ADN por nanoporos (Nanopore Sequencing):
consiste en leer el código de una sola cadena de ADN cuando ésta atraviesa unos poros minúsculos (nanoporos) incrustados en una membrana. A medida que el ADN se desplaza por el poro, se producen pequeños cambios en la corriente eléctrica que se traducen en la lectura de los diferentes nucleótidos del ADN. Este método permite estudiar cadenas largas de ADN con rapidez y bajo coste.
PCR digital:
es una reacción en cadena de la polimerasa en la que la muestra se fracciona primero en muchos subvolúmenes (en micropocillos, cámaras o gotitas) de forma que cada fracción contiene pocas o ninguna secuencia diana. Tras la PCR, la proporción de fracciones con amplificación positiva sirve para calcular la concentración de la secuencia diana mediante un análisis estadístico (distribución de Poisson).
Multiplex Ligation dependent Probe Amplification (MLPA):
técnica de PCR multiplex que utiliza un único par de cebadores para amplificar hasta 60 sondas, cada una con una diana genómica y una longitud única. Los amplicones de la PCR se marcan con fluorescencia y se separan y cuantifican mediante electroforesis capilar. Comparando el patrón de picos resultante de una muestra con los de un conjunto de muestras de referencia, se puede determinar el número de dianas genómicas presentes en la muestra de interés. Esta técnica se utiliza para estudiar las variaciones en el número de copias (CNV) de genes asociadas a enfermedades, pudiendo detectar CNVs que comprenden desde exones individuales a cromosomas completos.
La conversión bisulfito del ADN
es la desaminación de las citosinas no metiladas a uracilo, dejando las bases metiladas 5-mC y 5-hmC. Este procedimiento puede ir seguido de amplificación por PCR o métodos de secuenciación masiva en paralelo para determinar el patrón de metilación de cada citosina en genes específicos o en todo el genoma.
La metilación del ADN fue la primera marca epigenética descubierta. La presencia de un grupo metilo en la posición del carbono 5 de los residuos de citosina de dinucleótidos CpG de la región promotora de un gen se asocia a la represión de la transcripción del dicho gen.
Fluorescence in situ Hybridization (FISH):
técnica basada en la hibridación del ADN nuclear de células interfásicas o de cromosomas metafásicos fijados a un cristal, con una sonda de ácido nucleico. Las sondas se marcan indirectamente con un hapteno o directamente mediante la incorporación de un fluoróforo. Se utiliza para diagnosticar enfermedades genéticas, cartografiar genes e identificar anomalías cromosómicas, y también para detectar inversiones y traslocaciones cromosómicas.
Mapeo óptico genómico (Optical Genome Mapping, OGM)
Nos permite analizar grandes fragmentos de ADN de manera directa sin necesidad de amplificar la muestra
es una técnica de análisis genómico que se basa en la hibridación de sondas marcadas con fluorescencia para detectar variantes y anomalías estructurales cromosómicas tales como duplicaciones, translocaciones, deleciones e inversiones a partir del ADN de sangre periférica, tejido fresco o cultivos celulares.
Las técnicas NGS se pueden dividir en dos grandes grupos:
las que generan lecturas cortas (<300 bases) y las que generan lecturas largas (>10.000 bases).
Características técnicas NGS de lecturas cortas
técnicas basadas en lecturas cortas, como Illumina y IonTorrent, tienen una tasa de error muy baja, por lo que suelen ser las más empleadas para secuenciación de muestras con el objeto de detectar mutaciones.
Características técnicas NGS de lecturas largas
las técnicas basadas en lecturas largas, como la tecnología SMRT de PacBio y la secuenciación por nanoporos de Oxford Nanopore, permiten obtener lecturas muy largas, de gran utilidad para muchos estudios, pero su tasa de error es demasiado elevada, no permitiendo su uso para la detección de mutaciones de cara al diagnóstico.
formato FASTQ,
Los resultados de secuenciación masiva se suelen almacenar en formato FASTQ, que contiene el nombre de la secuencia, la secuencia obtenida, así como la calidad de cada base, expresada en un tipo de puntuación llamado Phred Score, que representa la probabilidad de que dicha base esté mal. Este tipo de información es de gran importancia para la identificación de variantes posteriores.
profundidad de secuencia, o profundidad de cobertura
Cuando se emplean técnicas NGS, uno de los parámetros más importantes a tener en cuenta es la profundidad de secuencia, o profundidad de cobertura. Indica el número de veces que de media se lee/secuencia cada base. Es un parámetro de gran relevancia ya que, a mayor profundidad, mayor capacidad se tendrá para detectar variantes, y más seguro se estará de que esa variante es real. Pero al mismo tiempo, más coste económico tendrá la secuenciación. Para un genoma completo se suele emplear una profundidad de 30X, para exoma 100-200X, y para paneles se suele estar en el orden de 500-1.000X, aunque estos parámetros pueden variar dependiendo del tipo de estudio a realizar.
la calidad del DNA para NGS
Los tejidos o muestras tumorales frescas o congeladas son mucho mejores que las muestras procedentes de bloques de parafina fijados. Esta fijación provoca roturas del DNA y modificación química de las bases, provocando la aparición de numerosos errores.
Las etapas de análisis de datos derivados de NGS consisten en:
alinear las lecturas al genoma de referencia, generar un fichero BAM, llevar a cabo el análisis del fichero BAM para detectar variantes, y explorar dichas variantes para detectar mutaciones que pudieran ser patogénicas.
Las lecturas alineadas al genoma de referencia se almacenan en un formato específico denominado
SAM (Sequence Alignment Map format) o BAM (su versión binaria y comprimida). Este fichero BAM contiene toda la información proveniente de la secuenciación (nombre de secuencia, secuencia y calidad de las bases) así como la información sobre dónde alinea cada lectura al genoma de referencia, cómo de seguros estamos que dicha lectura alinea en esa posición, dónde alinea la lectura pareada, en qué orientación están ambas lecturas…
Los parámetros que afectan a la identificación de variantes son:
tasa de error (discriminar entre variantes reales y errores)
Calidad de la base (proporcionada por el instrumento)
Calidad de mapeo (cómo de seguro se está de que la lectura alinea en esa posición del genoma)
profundidad de lectura (a mayor número de lecturas, mayor potencia estadística para detectar variantes).
Los factores que afectan a la detección de mutaciones en muestras tumorales son
la profundidad, calidad de base y mapeo (como en la detección de variantes germinales), pero también la pureza tumoral (si hay células normales en el tumor se dificulta la detección), la pureza de la muestra no tumoral (presencia de células tumorales en el normal), y la presencia de mutaciones subclonales (su detección se dificulta a medida que el porcentaje de células con mutación disminuye).
PCR cuantitativa (qPCR)
se puede ver y cuantificar en tiempo real la amplificación del transcrito de interés al usar marcadores fluorescentes cuya emisión puede detectarse y medirse en cada ciclo de la reacción de PCR y que es proporcional a la cantidad de ADN amplificado de interés.
PCR clásica
los oligos o primers se sitúan en ambos sentidos y se copia la doble cadena de ADN mediante los pasos de desnaturalización del ADN, anillamiento de los primers y amplificación, repetido un número determinado de ciclos. Permite detectar la cantidad de producto amplificado al final de la reacción.
nCounter-nanoString
- La característica principal es que esta metodología no necesita retro transcripción, no utiliza enzimas, ni amplificación.
- Es una plataforma automatizada; con este sistema se hibridan sondas con barcodes o códigos de barra únicos y específicos de secuencia y que permiten una cuantificación digital del número de copias. Se unen directamente a la secuencia diana permitiendo la cuantificación absoluta, sin amplificación, de hasta 800 dianas diferentes.
- Se necesitan dos sondas específicas del gen a analizar: una con el “código de barras” específico del gen concreto y la otra unida a biotina que serviría para la captura.
- Es aplicable a ARN extraído de tejido fijado en formol y embebido en parafina.