Alineamiento de secuencias Flashcards
César Poot
Alineamiento de secuencias (AS) es:
acomodamiento de dos o más secuencias de una manera en la que se alcance el máximo de coincidencias entre ellas
El fundamento de los alineamientos es:
las secuencias homólogas comparten cierto grado de identidad y similitud
Homología entre secuencias significa:
- comparten un ancestro común
- no tienen la misma función
Identidad indica:
proporción de pares de residuos o nucleótidos idénticos entre dos secuencias alineadas
se mide en %
depende de como se realizó el alineamiento
Similitud indica:
proporción de pares de residuos similares entre dos secuencias
depende de las matrices de sustitución usadas para el alineamiento
tipos de secuencias homólogas
ortólogos:
- el mismo gen pero en otra especie
parálogos:
- genes homólogos que están dentro del mismo genoma (de un mismo individuo)
- forman familias génicas
Regiones de los alineamientos
- Match:
- donde las secuencias se alinean (los nucleótidos coinciden: A con A)
- secuencias conservadas –> ricas en matches
- Mismatch:
- asociado a mutación
- cuando C con T
- Gap:
- interrupción (guión/espacio)
- se introduce artificialmente en el alineamiento para maximizar la coincidencia entre secuencias
( AGCTGA –> AGC-GA) - cuando G con -
- Indel:
- re-inserción o eliminación de secuencias
(AGCTGA –> AGCGA)
Xenólogo es:
gen que surge de un proceso de transferencia horizontal de genes entre especies diferentes
Herencia/Transferencia vertical es:
Transferencia de material genético de padres a hijos dentro de una especie
Herencia/Transferencia horizontal es:
Transferencia de material genético de un organismo a otro sin que exista parentesco
común en bacterias
Tipos de alineamiento
Global:
Trata de alinear toda la secuencia
Local:
Alinea las regiones de mayor similitud
(Estos alineamientos son preferibles)
¿Cómo evalúas un alineamiento?
Matriz de sustitución:
- PAM (de menor a mayor)
- BLOSUM (de mayor a menor): toma bloques de proteínas alineadas que no tengan gaps, aumentando la información que le das a la matriz
¿Cómo calificas el alineamiento (Score) con la matriz de sustitución (MS)?
Score = valores de la MS + penalización de gaps
la penalización es un valor negativo
¿Qué es un buen Score?
No se sabe, usas un gumbel (gráfico de distribución) para ver si el score es significativo o no
p-value representa:
probabilidad de encontrar un alineamiento con un score igual o mayor al obtenido