Alineamiento de Secuencias Flashcards
Qué es un alineamiento de secuencias
Forma de organizar las secuencias de DNA, RNA o Proteínas, una de “consulta” (query) frente a una de referencia, para identificar regiones similares entre ellas que pueden ser debido a relaciones evolutivas, estructurales o funcionales entre ellas.
¿Qué utilidad tiene el alineamiento de secuencias?
Si 2 secuencias en una alineación comparten un ancestro común, los desajustes pueden interpretarse como mutaciones puntuales y las brechas (gap) como indeles (es decir, mutaciones de inserción o eliminación) introducidas en uno o ambos linajes en el tiempo desde que divergieron entre sí.
Características
- Estima similitud
- Infiere relaciones evolutivas
- Se usan Diagramas de puntos para análisis gráfico
- Alineaciones locales o globales para análisis de residuos/residuos
Alineación de secuencia por pares
Se comparan 2 secuencias biológicas ( podría ser ADN, ARN o proteína)
Alineación de secuencias múltiples
compara 3 o más secuencias biológicas
Características alineación por pares
Puede ser categorizado en como:
- Alineamiento global
- Alineamiento local
Identifica regiones conservadas entre 2 secuencias.
Busca similitud en relación a una base de datos de referencia.
Herramientas ejemplo:
BLAST, LAIGN, EMBOSS Needle, EMBOS Water.
Algoritmos de alineamiento por pares
- Dot plot:
Exploración general de tu secuencia
Descubrimiento de repeticiones
Hallazgos de grandes Indels
Identificación de regiones para un alineamiento múltiple posterior - Alineamientos locales:
Comparación de secuencias con homología parcial
Alineamientos de alta calidad
Análisis de residuo por residuo - Alineamiento Global:
Comparación de secuencias sobre su longitud total
Hallazgos de grandes Indels
Revisión de calidad de los datos
Identificación de el total de mutaciones en tus secuencias
método más simple para identificar similitudes entre 2 secuencias
Dot Plot
- Ideal para buscar características que pueden aparecer en diferentes órdenes
- Revela patrones complejos
Dot Plot
Algoritmo Needleman-Wunch
- El problema se resuelve con métodos de optimización
- Se genera una matriz de (m+1)x(n+1); donde:
m= tamaño de la primera secuencia
n= tamaño de la segunda secuencia - Cada celda celda es asignada con el valor definido por el usuario basado en 3 condiciones
Match
Mismatch
Gap
Algoritmo Smith and Waterman
Optimizado para alineamientos locales.
La vía de alineamiento puede iniciar en cualquier punto.
El valor mínimo permitido es 0
Tipos de alineamiento de pares de secuencias
- Dot Plot
- Algoritmo Needleman-Wunch
- Algoritmo Smith and Waterman
Tipos Alineamiento de secuencias multiples
- CLUSTAL W/X
- T-COFFEE
- 3DCOFFEE
- MUSCLE
CLUSTAL W/X
Alineamiento progresivo
T-COFFEE
Árbol y alineamiento basado en consistencia