Structure secondaire Flashcards
Les brins / feuillets β
Structure périodique étendue, stabilisée par des liaisons hydrogène inter– brins
Longueur moyenne: 5-10 résidus
Structure secondaire
Organisation locale de la conformation des résidus de la séquence
Organisation liée aux chaînes principales mais pas uniquement:
deux séquences identiques
peuvent présenter des structurations secondaires différentes
Angles dièdres du squelette réguliers ⇒
diagramme de Ramachandran
Les hélices
• Repliement périodique de forme hélicoïdal
• Hélice droite = sens horaire
• Hélice gauche = sens anti-horaire
• Liaisons hydrogène entre les groupements COi et NHi+c
• c = connectivité de l’hélice
(définit le type d’hélice)
Les hélices α
Structure compacte
• Liaisons hydrogène interne entre COi et NHi+4
• 3, 6 résidus par tour d’hélice
• Chaînes latérales tournées vers l’extérieur
Les différents types d’hélices
alpha, 310, pi
Les feuillets β
- Association de plusieurs brins β par des liaisons hydrogène inter– brins
- Un feuillet est plissé, et non plan
Autres structures secondaires :
- Hernie β
- Coude
- Pelote statistique
Hernie β:
insertion d’un résidu avec des angles dièdres dans un brin β ⇒ rupture du
motif des liaisons hydrogène
Coude:
repliement du squelette carboné sur une longueur de quelques résidus pour relier
2 structures
Pelote statistique:
repliement non périodique mais stable (coil en anglais)
Structures secondaires
• Repliements locaux de la chaîne principale d’une protéine
• Formées par un réseau de liaisons hydrogène backbone/backbone
• Correspondent à des séries de valeurs spécifiques des angles dièdres φ et ψ ⇒ diagramme
de Ramachandran
Répartition des structures secondaires
- Hélices α: ~30% des résidus
- Feuillets β: ~20% des résidus
- Structures à haute stabilité énergétique
- MALEK plutôt dans les hélices, WYVIT plutôt dans les feuillets
Attribution des structures secondaires
À partir de la structure 3D d’une protéine, on détecte les zones de structuration secondaire et
leur type
Intérêts de l’attribution
- Indice du fold de la protéine
- Lié à la fonction de la protéine
- Permet de mieux aligner les séquences
- Utile pour la prédiction de structure tertiaire
Méthodes d’attribution
- DSSP (1983): basé sur la recherche de liaisons hydrogène potentielles
- DEFINE (1988): distances entre les carbones α
- P-CURVE (1989): fonction de trace/backbone
- STRIDE (1995): rajoute un critère d’angle à DSSP
DSSP
Méthode basée sur la recherche de liaisons hydrogène potentielles
S’appuie sur deux observations:
• 90% des atomes donneurs et accepteurs de liaisons hydrogène au sein de la chaîne
principale forment des liaisons hydrogène
• 62% de ces liaisons sont intra-backbone
Structures DSSP
- Hélice α: i →i + 4
- Hélice 310: i →i + 3
- Hélice π: i →i + 5
- Feuillets β: 3 liaisons H i − 1, i, i + 1 →j − 1, j, j + 1
- n-turn: liaison unique i →i + n
- Bend: angle [Cα(i) − Cα(i − 2)], [Cα(i) − Cα(i + 2)]
DEFINE
Compare les distances inter-Cα à un masque de structures secondaires idéales
P-Curve
• Analyse la courbure de la protéine
• Assigne les structures en fonction de la différence d’angles entre les plans peptidiques par
comparaison à une base de motifs idéaux
STRIDE
- Calcul des liaisons hydrogène potentielles et des angles dièdres φ − ψ
- Angles définissent les structures secondaires (Ramachandran)
- Ehbond ignorée si les angles sont défavorables
Répartition non uniforme des acides aminés: propension
• Hélices α riches en A, L, pauvres en P et G
• Heuillets β riches en V, I, pauvres en G, P et D
• Hélices 310 riches en P, pauvres en A, L
• Coudes β pauvres en V, I
• Aucune méthode d’attribution n’utilise ces informations → base des premières méthodes
de prédiction des structures secondaires
Prédiction de la structure secondaire
À partir de la séquence seule, prédire la structuration secondaire: hélice, brins, boucle . . .
pour chaque résidu de la protéine
Note: après la prédiction, il faut valider la qualité de cette prédiction!
• Un des premiers défis de la bio-informatique (~1967)
• Issu d’une observation simple: un enchaînement d’acides aminés particulier a une
structure secondaire préférentielle
De nombreuses méthodes prediction
- Approche statistique (Chou-Fasman, GOR)
- Homologie (Levin)
- Thermodynamique (Eisenberg, Lim)
- Évolution dirigée (Barton, Niemann)
- Apprentissage (Qian-Sejnowski, Karplus)
- Reconnaissance de motifs (Cohen, Rooman)
- Méthodes combinées (Rost, Levin, Argos)
Facteur de qualité
• Q3 = (A + C)/N
A = Vrai positif (Prédit SSr, attribué SSr)
B = Faux positif (Prédit SSr, attribué boucle)
C = Vrai négatif (Prédit boucle, attribué boucle)
D = Faux négatif (Prédit boucle, attribué SSr)
• Quid de la valeur de Q3 pour une prédiction aléatoire?
Chou-Fasman (1974): principe
• Approche statistique: exploite la répartition non uniforme des acides aminés dans les
structures secondaires
• Pour chaque acide aminé de la séquence, on détermine empiriquement des coefficients
reflétant leur propension P(α) à se trouver dans une hélice α, P(β) dans un feuillet β ou
P(c) dans une boucle (“coil”)
• Calcul sur une fenêtre (effets de voisinage)
- Propension = fréquence normalisée par rapport à une valeur moyenne de 1
- Pro(AA,ss) = freq(AA,ss)/freq(AA)
- freq(AA,ss) = N(AA,ss)/N(ss)
- freq(AA) = N(AA)/Ntotal (AA)
Chou-Fasman: règles pour les hélices
• Recherche de clusters de 6 résidus dont 4 avec une forte propension à être en hélice α
• Étendre dans les deux directions jusqu’à rencontrer un tétra-peptide dont hP(α)i < 1.00
Hélice
Tout segment de six résidus ou plus avec hP(α)i ≥ 1.03 et hP(α)i ≥ hP(β)i et respectant les
règles précédentes est prédite comme hélice
Chou-Fasman: règles pour les feuillets
• Recherche de clusters de 5 résidus dont 3 avec une forte propension à être en feuillet β
• Étendre dans les deux directions jusqu’à rencontrer un tétra-peptide dont hP(β)i < 1.00
Hélice
Tout segment de six résidus ou plus avec hP(β)i ≥ 1.05 et hP(β)i ≥ hP(α)i et respectant les
règles précédentes est prédite comme feuillet
Limites de l’algorithme Chou-Fasman
- Ne prend pas en compte les informations à distance (> 3 résidus)
- Les propensions ne sont pas additives en réalité
- hQ3i ∼ 55% dans les meilleurs cas