Chap 4 Flashcards
Quel est le but quand on fait un comparison d’une séquence avec des séquences déjà connue et répertorié dans les bases de donnée ?
Obtenir des infos sur la séquence inconnue garce aux infos déjà dispos dans les banques de données.
- On va faire une transfert d’information, déduction, homologué
- annotation par rapport a des séquences similaires : homologues putatifs
Quel est le problème quand on veut faire aligner une séquence avec celles de la BDD ?
Quelle est la solution ?
- temps de calcul augmente linéairement avec la taille de la banques : trop long, trop lourd ‼️
-calculer dans un temps raisonnable : développement de programme de recherche de similarité dans les banques de données
: BLAST et FASTA
BLAST et FASTA
- ils comparent quoi à quoi ?
- leur but
- résultat
- comparer 1 seq de la banques similaire à la séquence d’intérêt donc trouver des homologues putatifs à notre séquence
- résultat : des alignement locaux 2 à 2 de seq
Qu’est-ce qu’un programme heuristique ?
Approximation ou simplification d’algorithmes plus ou moins justifié permet de réduire de manière astucieuse le temps de calcul ou la complexité de l’algorithme
—> on peut sacrifier un peu de sensibilité à la menthode
Principe de FASTA
🔹 index tous les mot de longueur on er leurs position dans la séquence. Identité entre les Ktuble
🔹diagonale
🔹alignement Smith-Waterman
Principe de BLAST
- formation de mot (hits) : le programme ne retient je les HSP > seuil
- utilise BLOSSUM
- recherche les similairites entre paire de mots etc
Blast ou FASTA pour les proteine ?
Et pour le nucleotides ?
Quelle stratégie adopter ?
On fait un blast car plus sensible pour les proteine
Et un FASTA pour les nucleotides, mais aussi plus lent.
Faire un blastN Et faire ensuite un FASTA
Que fait le blast 2 ?
Alignement local avec gap : sélectionne les meilleures HSP
E value
Le nombre attendu d’alignement qui par chance aurait un score >ou égal à 5 lors de la comparaison de séquences aléatoires
Plus elle est petites plus elle est significative
Blast 10
BLASTn
Séquence requête : nucleotides
Types de BDD : nucleotides
Trouver les exons introns d’un gène
BLASTp
Séquence requête : protéique
Type de BDD : protéique
Recherche des protéines homologues
BLASTx
Séquence requête : nucléique (traduire dans les 6 cadre)
Type de BDD : protéique
Identification des régions codantes des sequence nucléiques
TBLASTn
Séquence requête : protéique
Type de BDD: nucléiques ( traduite dans les 6 cadres )
Trouver les régions génomiques correspondant à la protéine (pseudogene
, gène non annoté etc )
Tblastx
Type de la séquence requête : nucléiques ( traduite dans les 6 cadres )
Types de BDD : nucléiques ( traduite dans les 6 cadres)
Revient à effecteur 36 blast p coûteux en énergie