Chap 2 Flashcards
Qu’est-ce que le % d’identité ?
Proportion de residues identiques entre séquence (même lettre).
Qu’est-ce que le % de similarité ?
🔸proportion de residues identiques et similaire.
🔸la similarité est basée sur des propriétés similaires entre protéine (+)
🔸comme les nucleotides ne sont pas similaires on aura le pourcentage de similarité = pourcentage d’identité.
% d’identité pour les séquences aléatoires
- protéique
- nucleotides
🔸protéiques : 20 as donc 1/20 = 5%
🔸nucleotides : 4b donc 1/4 = 25%
Définir l’homologie
🔹2 séquences qui possèdent un lien de parenté, un ancêtre commun ( inféré à partir de la similarité).
🔹En bioinfo si 2 ou plusieurs séquences possèdent des residues conserves cela signifie quelles ont une histoire évolutive commune. Elles ont évoluée à partir d’une séquence ancêtre commune.
Définir l’analogie
Évolution évolutive convergente, les similarités entre les deux séquences sont apparues de manière indépendante.
Duplication
Mutation génétique caractérisée par le dédoublement du matériel génétique
Spéciation
Apparition d’une nouvelle espèce par séparation entre deux populations.
Orthologie
Le dernier ancêtre commun de 2 séquences homologues a subit une spéciation.
Paralogie
Deux gènes sont paralogues si leur duplication est due à la duplication d’un genre ancêtre
( on aura une différence au sein d’une même espèce)
xenologie
Gène acquis par transfert horizontal de gène.
Quelles sont les raisons d’une similarité sans homologue ?
▪️longueur de l’alignement court
▪️e value élevée >x10^10
▪️existence de région de faibles complexité
Alignement
- principe
- But
🔸 principe : on aligne 2 ou plusieurs séquences d’ADN-ADN ou ADN-ARN ou PROT-PROT de manière à faire ressortir les régions homologues
🔸But ❤️ : disposer les residues pour identifier les residues homologues en maximisant le nombre d’identité ou le nombre de similarité dans les différentes séquences
-on introduit alors des gaps pour les aligner sur des colonnes successives
Définir un alignement globale
Alignement sur la totalité de la longueur des 2 séquences que l’on compose ( introduction de gap)
Définir l’alignement local
Alignement des régions similaires entre elles : on ne force pas l’alignement sur la totalité de la séquence
De quoi dépend la valeur du score ?
Et à quoi servent-il ?
La valeur du score dépend :
▪️de la matrice utilisée
▪️de la longueur de l’alignement
▪️système de score utilisé
❤️Les scores élémentaires servent à optimiser un alignement.