alineamiento de secuencias genómicas Flashcards
Es una forma de organizar las secuencias de DNA, RNA o proteínas, una de ¨consulta¨ (query) frente a una de referencia, para identificar regiones similares entre ellas que pueden ser debido a relación evolutivas, estructurales o funcionales entre ellas.
Un Alineamiento de secuencias
Técnica para comparar dos o más secuencias de ADN, ARN o proteínas con el objetivo de encontrar similitudes y diferencias entre ellas.
Alineamiento de secuencias.
Cuando en el alineamiento de las dos secuencias NO coinciden cierto nucleótidos, esos desajustes (mismatches) pueden interpretarse como:
mutaciones puntuales
Las mutaciones puntuales son cambios en ?
Cambios en UNA SOLA BASE del ADN (como, una sustitución de una adenina por una guanina)
Brechas (gaps) son?
Son espacios vacíos que aparecen cuando una secuencia tiene más o menos bases en ciertos lugares.
Lasd brechas (gaps) se interpretan como indeles, que son mutaciones que pueden ser de?
Mutaciones de inserción (+ bases)
Mutaciones de eliminación/lesión (-bases)
en una alineación cómo saber si hay mutación deleción (eliminación) o mutación de inserción?
Si la de REFERENCIA tiene un segmento que una de las secuencias NO tiene, se interpreta como como eliminación deleción en esa secuencia.
Si la REFERENCIA NO tiene ese segmento, pero una de las secuencias lo tiene, se interpreta como inserción en la secuencia.
Si la de REFERENCIA tiene un segmento que una de las secuencias no, ¿es mutación de que tipo?
Mutación deleción (eliminación)
Si la de REFERENCIA no tiene un segmento y la secuencia si, ¿qué tipo de mutación es?
Mutación de inserción.
Principal objetivo del alineamiento de secuencias:
estima similitud
Alineamiento de secuencias:
Características ()
- Estima similitud
- Infiere relaciones evolutivas
- Se necesitan herramientas más precisas para analizar las secuencias en detalle, como:
-Diagramas de puntos para análisis gráfico.
-Alineaciones locales o globales para análisis de residuos. - El procedimiento de alineación comparando dos secuencias biológicas (podría ser ADN, ARN o proteína) se denomina alineación de secuencia por pares.
- El procemiento de alineación que compara tres o más secuencias biológicas se denomina alineación de secuencias múltiples.
Alineamiento de pares de secuencias
Características:
- Identifica regiones conservadas entre dos secuencias.
- Busca similitud en relación a una base de datos de referencia.
Alineamiento de pares de secuencia, es?
El procedimiento de alineación comparando dos secuencias biológicas (podría ser ADN, ARN o proteína).
Alineamiento local
características
(te pareces a tú papá)
- Comparación de secuencias con homología parcial.
- Alineamientos de alta calidad.
- Análisis de residuo por residuo.
- N0 permire identificar indels
alineamiento de pares de secuencias, se categoriza en ?
- Alineamiento global
- Alineamineto local
alineamiento de pares de secuencia
Herramientas
- BLAST
- LAIGN
- EMBOSS
- Needle
- EMBOS WATER
Alineamiento globales
Características
(que tanto te pareces de pies a cabeza a tu papá)
- Comparación de secuencias sobre su longitud total
- Hallazgos de grandes indels (m. inserción y deleción)
- Revesión de calidad de los datos
- Identificación de el total de mutaciones (GAPS) en tus secuencias.
Se necesitan herramientas más precisas para analizar las secuencias en detalle, como:
Diagramas de puntos para análisis gráfico. → Dot plot (gráfico de puntos).
-Alineaciones locales o globales para análisis de residuos.
Dot plot (gráfico de puntos)
¿Qué es?
El diagrama de puntos es una representación gráfica de la similitud por pares.
Es una representación gráfica de la similitud por pares.
Diagrama de puntos
Método más simple para identificar similitudes entre 2 scuencias.
Do plot (gráfico de puntos)
Ideal para buscar características que pueden aparecer en diferentes órdenes.
Dot plot (gráfica de puntos)
Revela patrones complejos
Dot plot (gráfico de puntos)
Dot plot (gráfica de puntos)
Características
- Método más simple para identificar similitudes entre dos secuencias.
- Ideal para buscar características que pueden aparecer en diferentes ordenes.
- Revela patrones complejos.
Del cuadro cuál es la de referencia y cuál es la de referencia?
Horizontal : obejtivo
Vertical : referencia
Algoritmos de alineamiento por pares
Dot plot -generalidades
- Exploración general de tu secuencia
- Descubrimiento de repeticiones
- Hallazgos de grandes indels
- Identificación de regiones para un alineamiento múltiple posterior.
Do plot
Interpretación
→ Secuencias divergentes donde solo un segmento es homólogo
→Inserción y deleción largas se desplazan.
→Repeticiones en tándem la forma cuadrada del patrón es características de estas repeticiones
Algoritmos ¿?
- Algoritmos de alineamiento por pares
- Algoritmo Needleman-Wunch
- Algoritmo Smith and Waterman
Algoritmo Needleman-Wunch
Características
- Optamizado para alineamientos globales.
- Se resuelve con métodos de optimización.
- Surge en 1970
- Se genera una matriz de (m+1)x(n+1):
m: tamaño de la primera secuencia
n: tamaño de la segunda secuencia - Cada celda es asignada con el valor definidido por el usuario basado en 3 condiciones:
-Match
-Mismatch
Gap
Computacionalmente el Dot-plot es complicado. v/f
v
Cada celda es asignada con el valor definidido por el usuario basado en 3 condiciones:
- Match (ganamos)
- Mismatch (penalización)
- Gap (penalización)
Reglas del algoritmo Needleman-Wunch
- Match score: 1
- Mismatch score: -1
- Gap score: -2
Algoritmo Smith and Waterman
generalidades
- Optimizado para alineamento locales.
- Un alineamiento local encuentra las regiones de mayor coincidencia entre dos secuencias.
- La vía de alineamiento no inicia de la parte inferior derecha a la parte superior izquierda, puede INICIAR en cualquier punto.
- Valor mínimo permitido es 0
ALINEAMIENTO DE SECUENCIAS MÚLTIPLES
Características
- Generalmente una alineación global
- Algoritmo complejo y sofisticado para detectar regiones de variabilidad o conservación en una familia de proteínas.
- Análisis filogenético
- Detección de homología entre un gen recién secuenciado y una predicción de estructura de proteína de una familia de genes existente.
- Demostración de homología en familias multigénicas.
Demostración de homología en familias multigénicas
ALINEAMIENTO DE SECUENCIAS MÚLTIPLES
Programas que realizan MSA
Programa: CLUSTAL
Algoritmo: alineamiento progresivo
URL:
Programa: T-COFFEE
Algoritmo: árbol y alineamiento basado en consistencia
URL:
Programa: 3DCOFEE
Algoritmo: Alineamiento basado en estructura
Programa muscle
algoritmo ptrogresivo basad en puntaje de espectativa de registro alineacion y refinamiento dependiente de árbol.
Herramienta más utilizada para búsqueda de secuencias en bases de datos
BLAST
Herramienta de búsqueda de alineación local básica
BLAST
Encuentra una región de similitud local (secuencia conservada) entre una secuencia de “consulta” de aminoácidos que conforman una proteína o la secuencia de nucleótidos del ADN frente a una base de datos de referencia .
blast
El objetivo final de un programa BLAST es inferir las relaciones evolutivas y funcionales entre dos secuencias de ADN o proteínas. La versión original de BLAST se lanzó en 1990; sin embargo, han surgido variantes especializadas en el alineamiento de secuencias en diversas bases de datos. VF
V
Algoritmo Smith and Waterman es para alineamiento?
Alineamiento local
Algoritmo Needlemam-Wunsch es para alineamiento?
Alineamiento global