4. IA Flashcards
Quelle est la différence entre un apprentissage automatique (machine learning) et un apprentissage profond (deep learning)?
L’apprentissage automatique est un algorithme entrainé à partir d’exemples alors que l’apprentissage profond est plus complexe, performant et opaque.
Quel est l’objectif de l’apprentissage automatique?
Prédire in silico une propriété d’intérêt sur un composé pour minimiser les tâches expérimentales.
Quelle est l’approche informatique de l’apprentissage automatique?
L’algorithme pour accomplir une tâche définie est conçu à partir d’exemples (Q&A). Il apprend des exemples pour généraliser les nouveaux exemples.
Nous avons besoin de 4 informations pour mettre en place l’apprentissage, lesquels? important
- jeu de données
- fonction pour modéliser les exemples
- fonction de coût
- algorithme d’optimisation
Dans quels contextes l’apprentissage est supervisé ou non-supervisé?
Supervisé = des exemples de réponses sont disponibles
Non-supervisé = on ne connaît pas la question
Question, réponse, entrée et sortie: lesquels sont associés à x ou y?
x: question & entrée
y : réponse & sortie
À quoi consiste l’apprentissage?
Identifier les paramètres libres de la fonction θ et les ajuster pour prédire au mieux les exemples connus.
Quelle est la dimensionnalité d’un jeu de données?
La taille de celui-ci.
C’est quel type de problème lorsque Y est discret ou continu?
Y discret = problème de classification
Y continu = problème de régression
Quels sont les deux rôles que peuvent prendre un jeu de données?
Rôle #1: utilisé directement pour l’apprentissage (training set)
Rôle #2: utilisé pour quantifier la performance de l’apprentissage (test set)
Pourquoi on retient des exemples pour tester l’apprentissage?
On teste l’apprentissage par de vrais exemples avec la question et la réponse pour s’assurer que la modèle a été bien entraîné. Si on réapplique les mêmes questions lors de l’apprentissage et du test, il ne va pas raisonner mais appliquer par sa mémoire. C’est l’examen qu’on fait passer au logiciel.
Lorsqu’on rajoute une couche cachée au réseau de neurone, qu’est-ce qui est rajouté?
Un paramètre
Expliquer le réseau de neurones.
Le réseau de neurones est inspiré de la façon dont le cerveau fonctionne. Chaque nœud est lié aux autres dans chaque couche. Plus on ajoute de données, plus il y a de couches cachées qui se rajoutent. Les données liées ensemble permettent de trouver un pattern. Le résultat final du réseau de neurones permet de prédire de façon précise une question qu’on pose.
Qu’est-ce que la fonction de coût?
C’est la distance entre la réponse prédite et la vraie réponse, donc il dit à quel point le modèle s’est trompé. Plus la distance est grande, plus le modèle s’est trompé.
Que quantifie la fonction de coût?
Elle quantifie combien de paramètres permettent de reproduire les Y des exemples à partir des X.