STS CM 4.2 Flashcards
Qu’est-ce qu’un médicament ?
C’est une substance ou composition possédant des propriétés curatives ou préventives à l’égard des maladies
Comment se fait le parcours d’un médicament en général ?
- Absorption par voie orale
- Passage dans l’estomac (libération PA)
- Passage dans l’intestin
- Rejoint la circulation sanguine
Qu’est-ce qu’on retrouve comme types de médicament ?
- Des petites molécules organiques (paracétamol)
- Des peptides ou des protéines (insuline)
- Des composés minéraux (cisplatine)
- Des virus (bactériophages)
….
Quels effets peut-on retrouver après liaison du médicament à son récepteur ?
Soit des inhibitions ou des inductions (augmentations)
Comment le médicament se fixe sur son récepteur ?
Il se fixe sur la cavité de la protéine par des liaisons inter-moléculaires
Comment marche le criblage par HTS ?
On a des milliers ou millions de puits qui contient chacune la prot ciblée
Puis on insère à chaque puit une molécule différente pour voir celles qui se lient
Comment décrit-on la liaison molécule/récepteur ?
Par le modèle clé-serrure
Clé = molécule
Serrure = Protéine
Quels sont les inconvénients du cycle de développement d’un médicament ?
C’est un processus long, coûteux et qui peut échouer
En moyenne 12,5 ans pour 1,36 milliards d’euros
En quoi consiste le criblage de molécules ?
Ca consiste à tester expérimentalement la liaison de toutes les molécules d’une chimiothèque (des
milliers voir des millions) à une protéine donnée
C’est une méthode expérimentale
Quelles sont les différentes étapes du cycle de développement du médicament ?
- Découverte d’une cible
- Identification de molécules actives
- Optimisation des molécules
- Essais précliniques (test sur animaux)
- Essais cliniques (test sur l’Homme)
Quelles sont les étapes du cycle de développement du médicament qui peuvent être faites par de l’IA ?
- Découverte d’une cible
- Identification de molécules actives
- Optimisation des molécules
En gros les 3 premières
Quels sont les inconvénients du criblage par HTS ?
C’est très couteux :
- Au niveau des machines
- Des molécules
- Des emplacements
On retrouverai combien de molécules qui pourraient se lier à une protéine d’origine humaine ?
10^60 molécules
Comment qualifie-t-on l’espace chimique ?
Comme immensément grand
Une campagne pour un médicament peut tester combien de molécules ?
Plusieurs millions (10 millions)
AUCUNE GARANTIE DE TROUVER UNE TOUCHE
Une chimiothèque peut posséder combien de molécules sur commande ?
20 milliards
En quoi consiste principalement l’optimisation ?
A rajouter des groupements ou à en modifier par exemple
L’optimisation d’une molécule permet de faire quoi ?
- Augmenter l’affinité
- Permettre une spécificité au récepteur
- La rendre non-toxique
- Améliorer ses propriétés physico-chimiques
Comment peut-on mieux trouver une molécule dans l’espace chimique ?
Par l’IA :
- Le criblage virtuel
- La génération de novo
Comment marche le criblage virtuel ?
L’IA va être une sorte de tamis qui va sélectionner des molécules dans une chimiothèque virtuelle par prédiction sur ses propriétés physico-chimique
A la fin on se retrouve avec quelques milliers de molécules à tester
Comment calcule t’on l’activité d’une molécule ?
Par l’équation de Hansch
activité = 𝑎 log 𝑃 − 𝑏 log 𝑃^2 + 𝑐𝜎 + 𝑑𝐸𝑠 + 𝑒
- logP - lipophilicité de la molécule
- σ - effet électronique
- Es - effet stérique
A quoi sert le docking ?
C’est une IA avec un algorithme simple
Elle permet de faire le criblage virtuelle par ancrage (docking) moléculaire
Combien de molécules sont testées par jour avec le docking ?
environ 3000 sur un simple ordinateur
Qu’est-ce que QSAR ?
Relation quantitative structure à activité/propriété (QSAR ou QSPR)
Comment marche le docking ?
C’est une méthode informatique
En déterminant la position et l’orientation de la molécule (ligand) dans la protéine dans un espace en 3 dimensions
Comment l’identification de molécules actives se fait par le docking ?
Par l’enthalpie libre de la formation du complexe
Par la constante de dissociation du complexe
De la liaison entre un ligand et une protéine quantifiable
plus ΔG ou Kd est faible ?
Meilleure est la liaison
Quels sont les différents types de fonctions de score ?
- Mécanique moléculaire (sur mol fixe), estimation des forces électrostatiques et de Van der Waals
- Empirique (régression linéaire multiple à partir de données expérimentales)
Quel est le gros inconvénient de la simulation par dynamique moléculaire ?
Très couteux en puissance de calcul
Quel est l’inconvénient des fonctions de score et comment le contrer ?
Les 2 types de fonctions de score ont des performances moyennes
Donc pour mécanique moléculaire, on le fait sur des simulations par dynamique moléculaire (donc molécule qui bouge)
Pour l’empirique, on fait du machine learning
Pourquoi pour un bon jeu de données, il faut un grand intervalle d’affinités ?
Pour avoir tout type d’affinités :
- Forte
- Moyenne
- Faible
- Très faible
Pour permettre à l’IA de généraliser ?
Comment on construit un bon jeu de données pour l’entrainement de l’algorithme ?
On prend des complexes ligands/prot et pas d’autres (ADN/ARN, prot/prot, ADN/prot)
Il faut des structures de bonne résolution
Avec des intervalles d’affinités grand
Et des protéines diverses
Quelles sont les caractéristiques des bases de données pour permettre l’entrainement de l’algorithme ?
Elles sont gratuites et nombreuses
Que décrit les descripteurs d’un complexe ligand/protéines ?
- Distance entre les atomes du ligand et de la protéine
- Le numéro atomique de l’atome
- La charge partielle de l’atome (positive ou négative)
- L’acide aminé de l’atome de la protéine
Ils permettent l’entrainement en deep learning
Quelle est la principale base de données pour l’entrainement de l’algorithme ?
PDB bind
Combien de structures 3D possède PDB bind
23 496 structures 3D dont l’affinité a été mesurée expérimentalement
Qu’est-ce qui se passe après l’entrainement de l’IA ?
Elle fait des prédictions de l’affinité de la molécule
Puis classe par ordre croissant l’affinité des molécules
Les meilleurs molécules seront testés expérimentalement
Est-ce que la performance des IA tient ses promesses ?
Non pour l’instant
Quelles sont les limitations de l’IA dans les mesures d’affinités ?
- Le nombre de structures de qualités avec les mesures d’affinités sont limités
- La distribution des affinités n’est pas homogène
Le criblage virtuelle des IA peut provoquer quoi ?
Une augmentation du ratio car il ne donne pas le bon ordre des affinités
IFP et GRIM sont des méthodes de ?
Fonction de score basée sur la similarité avec d’autres structures connues
Surflex est une méthode de ?
De fonction de score empirique
Pafnucy est une méthode de ?
Deep learning
ΔvinaRF20 est une méthode de ?
Forêt aléatoire
Retrouve-t-on une corrélation entre l’affinité prédite et expérimentale avec Pafnucy et ΔvinaRF20 ?
Non
Quel est l’ordre d’efficacité entre les fonctions de score ?
Méthodes basées sur la similarité > performance des IA > à la fonction de score empirique
Quels sont les étapes ADME ?
- Absorption (voyage médoc du site d’absorption vers le système sanguin)
- Distribution (voyage médoc du système sanguin au site d’action)
- Métabolisme (manière dont mol est dégradé en métabolites par l’organisme)
- Excrétion (comment mol ou ses métabolites sont éliminer par l’organisme par les voies naturelles )
Rajout de la toxicité
Est-ce que tout le médicament arrive dans la circulation sanguine ?
Non seulement une fraction
Quels sont les différents endroits où passe le médicament après voie orale ? (simplifié
- Bouche
- Intestin
- Paroi
- Système sanguin
certaines propriétés physico-chimiques favorise le passage dans le système sanguin ? Lequel ?
Oui la lipophilicité ou logP
A quel intervalle de logP doit se trouver une molécule ayant de bonnes propriétés pharmacocinétiques ?
Entre -2 et 5
Quel est la définition de la lipophilicité ?
Rend compte du caractère lipophile (ou hydrophobe) (apolaire) de la molécule
Si logP < 0 ?
La molécule est hydrophile
Si logP > 0 ?
La molécule est lipophile
Qu’est-ce que la RMSE ?
L’erreur quadratique moyenne
L’état de la protonation de la molécule influe sur son hydrophobicité ?
Oui
Comment est mesurée expérimentalement le logP ?
Par ajout de molécules dans un contenant contenant 2 solvants (un hydrophile (eau) et un hydrophobe (octan-1-ol p.e)
Puis mesure de la concentration de la mol dans chaque solvant
Puis 𝑙𝑜𝑔𝑃 = 𝑙𝑜𝑔 x [𝐴] octan−1−ol/[𝐴] eau
Si RMSE faible ?
Meilleure est la méthode
Aujourd’hui c’est une méthode de mécanique quantique qui est la meilleure
Comment est prédit le logP par des IA ?
Par des descripteurs topologiques
- basée sur les fragments
- basées sur les atomes et les liaisons
Principe de la métabolisation ?
Rendre une molécule hydrophobe en des molécules moins hydrophobes après le passage dans le foie pour élimination
Que fait-on dans la phase 1 de la métabolisation ?
Ajout d’un groupement réactif et polaire
Les cytochromes P450 sont responsables de la métabolisation des médicaments sur le marché ?
Oui à 58%
Quel est le but d’une méthode de prédiction dans la métabolisation ?
Idéalement, un modèle est capable de prédire tous les métabolites et les enzymes impliquées
Quels sont les différents effets des métabolites ?
- Inhibition d’une enzyme
- Induction d’une enzyme
- Toxicité
- Prodrogue : mol inactive devient active après foie
La base de données de l’identification des sites réactifs est composée de quoi ?
- 680 molécules + les métabolites observés expérimentalement
- 9 enzymes CYP450
Qu’est-ce que fait la génération de novo ?
Une QSAR/QSPR inverse
On lui donne des caractères et elle donne une structure
Quels sont les descripteurs de l’identification des sites réactifs ?
Basés sur les atomes :
- Topologique (numéro atomique des atomes et la distance entre eux)
- Quantique (charge atome, nucléophilicité, électrophilicité, densité en e- ….)
Basés sur la molécule :
- LogP
- Volume
- Surface polaire
- Diamètre
Comment identifie-t-on les sites réactifs avec les IA ?
Par Xenosite qui donne une probabilité qu’un site est réactif
Parfois il permet de donner le type de réaction
Quels sont les limitations des IA dans la prédiction de la métabolisation ?
- Peu de données
- Spécifiques au CYP450
- Prédiction des sites actifs seulement et de quelques réactions
A quoi sert l’espace latent ?
A faire du morphing et donc de trouver des structures chimiques intermédiaires en voyageant dedans
Comment est composé une génération de novo ?
D’un autoencodeur variationnel (VAEà*)
On a un un encodeur qui va compresser
On a un un décodeur qui va décompresser
Entre ses 2 là on a un vecteur/espace latent
Que permet de faire l’optimisation multi objectif ?
D’avoir une molécule qui a toutes les caractéristiques bonnes
Les données afin d’entrainer les IA sont en quantité suffisante afin de parfaitement décrire le problème ?
Non
Certaines méthodes numériques peuvent se substituer aux méthodes expérimentales ?
Oui et inversement aussi
Certaines méthodes numériques sont utilisées comme étape préliminaire ?
Oui comme dans le filtrage p.e