4. IA Flashcards

1
Q

Quelle est la différence entre un apprentissage automatique (machine learning) et un apprentissage profond (deep learning)?

A

L’apprentissage automatique est un algorithme entrainé à partir d’exemples alors que l’apprentissage profond est plus complexe, performant et opaque.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quel est l’objectif de l’apprentissage automatique?

A

Prédire in silico une propriété d’intérêt sur un composé pour minimiser les tâches expérimentales.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quelle est l’approche informatique de l’apprentissage automatique?

A

L’algorithme pour accomplir une tâche définie est conçu à partir d’exemples (Q&A). Il apprend des exemples pour généraliser les nouveaux exemples.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Nous avons besoin de 4 informations pour mettre en place l’apprentissage, lesquels? important

A
  1. jeu de données
  2. fonction pour modéliser les exemples
  3. fonction de coût
  4. algorithme d’optimisation
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Dans quels contextes l’apprentissage est supervisé ou non-supervisé?

A

Supervisé = des exemples de réponses sont disponibles
Non-supervisé = on ne connaît pas la question

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Question, réponse, entrée et sortie: lesquels sont associés à x ou y?

A

x: question & entrée
y : réponse & sortie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

À quoi consiste l’apprentissage?

A

Identifier les paramètres libres de la fonction θ et les ajuster pour prédire au mieux les exemples connus.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quelle est la dimensionnalité d’un jeu de données?

A

La taille de celui-ci.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

C’est quel type de problème lorsque Y est discret ou continu?

A

Y discret = problème de classification
Y continu = problème de régression

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quels sont les deux rôles que peuvent prendre un jeu de données?

A

Rôle #1: utilisé directement pour l’apprentissage (training set)
Rôle #2: utilisé pour quantifier la performance de l’apprentissage (test set)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Pourquoi on retient des exemples pour tester l’apprentissage?

A

On teste l’apprentissage par de vrais exemples avec la question et la réponse pour s’assurer que la modèle a été bien entraîné. Si on réapplique les mêmes questions lors de l’apprentissage et du test, il ne va pas raisonner mais appliquer par sa mémoire. C’est l’examen qu’on fait passer au logiciel.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Lorsqu’on rajoute une couche cachée au réseau de neurone, qu’est-ce qui est rajouté?

A

Un paramètre

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Expliquer le réseau de neurones.

A

Le réseau de neurones est inspiré de la façon dont le cerveau fonctionne. Chaque nœud est lié aux autres dans chaque couche. Plus on ajoute de données, plus il y a de couches cachées qui se rajoutent. Les données liées ensemble permettent de trouver un pattern. Le résultat final du réseau de neurones permet de prédire de façon précise une question qu’on pose.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qu’est-ce que la fonction de coût?

A

C’est la distance entre la réponse prédite et la vraie réponse, donc il dit à quel point le modèle s’est trompé. Plus la distance est grande, plus le modèle s’est trompé.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Que quantifie la fonction de coût?

A

Elle quantifie combien de paramètres permettent de reproduire les Y des exemples à partir des X.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qu’indique un gradient?

A

Elle indique dans quelle direction de la fonction on augmente le coût le plus vite.

17
Q

Qu’est-ce que le surapprentissage?

A

Lorsque le modèle apprend par cœur au lieu de comprendre la relation de la question et de la réponse.

18
Q

Comment peut-on voir dans un graphique lorsqu’il y a un phénomène de surapprentissage?

A

Lorsque le MSE (mean squared erreor) du test est supérieur au MSE de l’entrainement.

19
Q

À quoi sert l’aire sous la courbe ROC?

A

À évaluer la performance de l’interprétation du coût.

20
Q

Dans l’apprentissage non-supervisé, l’exemple ne contient qu’un input puisque l’output est une valeur abstraite. Que cherche-t-on à identifier dans ce cas-ci?

A

On chercher à identifier une structure dans l’ensemble d’apprentissage.

21
Q

Quelles sont les variantes dans un réseau de neurones?

A

Connexions entre les couches, la fonction objectif et le partage des poids.

22
Q

Que sont le m et le n?

A

m : colonnes = dimensions, variables, gènes, pixels, etc.
n : rangées = observations, exemples, échantillons, patients, mesures, etc.

23
Q

Que se passe-t-il si un modèle à moins d’exemples qu’il y a de paramètres à ajuster?

A

Le modèle est sous-déterminé.

24
Q

À quoi réfère la capacité d’un modèle?

A

Elle réfère à la complexité de fonctions qu’il peut représenter. Il est influencé par le nombre de paramètres libres.

25
Q

V ou F, il ne faut pas nécessairement une grande quantité de données pour dériver un modèle d’une grande capacité.

A

F, c’est d’ailleurs à cause de ça que le surapprentissage survient lorsque la capacité du modèle est supérieure au nombre d’exemples.

26
Q

Qu’est-ce que la validation croisée?

A

Il permet d’évaluer la performance des modèles d’apprentissage automatique.

27
Q

Que fait la régularisation?

A

Elle identifie les matrices W (poids) qui minimisent la fonction objectif. Elle incite l’algorithme à identifier une solution avec des petits W.