Chap 2 Flashcards

1
Q

Qu’est-ce que le % d’identité ?

A

Proportion de residues identiques entre séquence (même lettre).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est-ce que le % de similarité ?

A

🔸proportion de residues identiques et similaire.

🔸la similarité est basée sur des propriétés similaires entre protéine (+)

🔸comme les nucleotides ne sont pas similaires on aura le pourcentage de similarité = pourcentage d’identité.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

% d’identité pour les séquences aléatoires

  • protéique
  • nucleotides
A

🔸protéiques : 20 as donc 1/20 = 5%

🔸nucleotides : 4b donc 1/4 = 25%

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Définir l’homologie

A

🔹2 séquences qui possèdent un lien de parenté, un ancêtre commun ( inféré à partir de la similarité).

🔹En bioinfo si 2 ou plusieurs séquences possèdent des residues conserves cela signifie quelles ont une histoire évolutive commune. Elles ont évoluée à partir d’une séquence ancêtre commune.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Définir l’analogie

A

Évolution évolutive convergente, les similarités entre les deux séquences sont apparues de manière indépendante.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Duplication

A

Mutation génétique caractérisée par le dédoublement du matériel génétique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Spéciation

A

Apparition d’une nouvelle espèce par séparation entre deux populations.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Orthologie

A

Le dernier ancêtre commun de 2 séquences homologues a subit une spéciation.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Paralogie

A

Deux gènes sont paralogues si leur duplication est due à la duplication d’un genre ancêtre
( on aura une différence au sein d’une même espèce)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

xenologie

A

Gène acquis par transfert horizontal de gène.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quelles sont les raisons d’une similarité sans homologue ?

A

▪️longueur de l’alignement court
▪️e value élevée >x10^10
▪️existence de région de faibles complexité

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Alignement

  • principe
  • But
A

🔸 principe : on aligne 2 ou plusieurs séquences d’ADN-ADN ou ADN-ARN ou PROT-PROT de manière à faire ressortir les régions homologues

🔸But ❤️ : disposer les residues pour identifier les residues homologues en maximisant le nombre d’identité ou le nombre de similarité dans les différentes séquences
-on introduit alors des gaps pour les aligner sur des colonnes successives

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Définir un alignement globale

A

Alignement sur la totalité de la longueur des 2 séquences que l’on compose ( introduction de gap)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Définir l’alignement local

A

Alignement des régions similaires entre elles : on ne force pas l’alignement sur la totalité de la séquence

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

De quoi dépend la valeur du score ?

Et à quoi servent-il ?

A

La valeur du score dépend :
▪️de la matrice utilisée
▪️de la longueur de l’alignement
▪️système de score utilisé

❤️Les scores élémentaires servent à optimiser un alignement.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Pourquoi la pénalité de l’identité est elle toujours supérieurs aux pénalités de mutation ?

A

La pénalité est toujours en faveurs de l’identité : il faut un maximum d’homologie.

17
Q

Pourquoi la pénalité de gap est-Elle toujours plus importante que la pénalité de substitution ?

A

La pénalité est gap est plus coûteuse que les autres car on sait que le substitution sont plus fréquence que les insertion et délétion.

18
Q

Définir le modèle kumura à 2 paramètre.

A

▪️modèle d’évolution : intégration de paramètre venant d’observation biologiques :
• Transision : AG et CT
• Transversion : AC et TG

▪️L’évolution est parcimonieuse :
1 événement mutationnel est plus probable que plusieurs événement mutationnels
•pénalité d’ouverture de gap : plus coûteuse
•pénalité d’extension de gap : moins coûteuse

▪️pénalité de gap > pénalité de substitution

19
Q

Pourquoi est-il plus difficile de modéliser des séquences protéiques ?

A

🔹un aa peut être remplacer par un autre de différentes façons ( code génétique).

🔹le nombre de substitution requises pour passer d’un aa a un autre différent.

🔹la probalite de substitution different.

🔹certaines substitution peuvent avoir plus ou moins d’effet sur la protéine.

20
Q

Que devons nous prendre en compte quand on compare des sequence protéiques ?

A

🔹 % identité

🔹 % de similarité

21
Q

Comment est construite une matrice de substitution?

Quelles sont les 2 approches pour modéliser les matrices de substitution ?

A

🔹A partir d’ensemble de séquences protéiques homologues et ayant la même fonction

🔹 on calcule la fréquence de chaque aa dans l’alignement et on les transforme en logo odds : si,j = log2( fi,j)/ (fi x fj )

🔹On a deux approches différente pour modéliser les matrices de substitution : PAM et BLOSSUM

22
Q

Matrice pam que signifie :

  • valeurs négatives
  • valeurs positives
  • % similaire positive
A

🔸valeurs négatives : substitution contre sélectionner au cours de l’évolution

🔸valeurs positivé : substitution favorisées au cours de l’evolution ( aa similaires )

🔸 % de similarité : proportion de residues quand une valeurs positivé dans la matrice de substituons

23
Q

Quelle type d’alignement fait une matrice pam ou JTT

A

Alignement globaux 2 x 2

24
Q

Matrice blossum : types d’alignement ?

Est-elle plus adapté pour des protéines d’instante d’un point de vue évolutif ?

A
  • alignement multiple de séquence
    Comparaison avec des domaines avec les alignement blocks

-oui

25
Q

quand choisis t-on ?

🔸PAM50 et BLOSSUM 80

🔸 PAM250 ou 350 et BLOSSUM 30

🔸PAM120 et BLOSSUM 62

A

🔸p50 et b80 : pour des séquences proches and l’évolution : trouver un alignement court et fortement similaire

🔸p250-350 et b30 : pour des séquences distantes dans l’évolution. De plus long alignement locaux et faible conservation

🔸p120 et b62 : pour des séquences ayant des distance évolutives intermédiaire : on utilise par défaut.