intelligence artificielle et neurosciences cognitives (cours 10) Flashcards

1
Q

Définition de l’apprentissage machine

A

Il s’agit d’algorithmes informatiques qui analysent un ensemble de données afin de déduire des règles qui constituent de nouvelles connaissances permettant d’analyser de nouvelles situations

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Que peut on faire avec l’apprentissage machine?

A
  • Prédire une évolution

- Classifier (catégoriser)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Différences entre Apprentissage supervisé vs non-supervisé?

A

Apprentissage supervisée: les données sont labélisées (classes prédéterminées)

Apprentissage non-supervisée : les données ne sont pas labélisées (Les classes/categories seront déterminées par l‘algorithme à partir des données)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

C’est quoi l’extraction d’attributs?

A

si on veut aider la machine, on va extraire les propriétés des sons

ex : tempo, …) = extraction d’attributs

Parfois je ne vais pas faire l’extraction des attributs des sons mais je vais prendre les sujets et je vais enregistrer les signaux pendant qu’ils écoutent aux chansons

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

C’est quoi le problème de classification à 2 classes?

A

Classification binaire. On a 2 classes/étiquettes (2 labels)

ex : label 1 (attentif) label 2 (distrait)

On mesure l’activité cérébrale et on crée un vecteur d’attributs ==> ensuite il y a classification

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Mais comment choisi t-on la fonction de décision?

A

Le choix de la fonction de décision se limite à une famille de fonctions fixée par le chercheur.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Nommez une fonction de décision possible

A

Une fonction de décision linéaire
La fonction f correspondra à la séparation de l’espace des attributs par un hyperplan (dans un espace de dimension N). Les observations se trouvant de chaque côté de l’hyperplan sera classifié 1 ou -1.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Comment est formalisé le classifieur binaire?

A

Peut être formalisée comme une fonction de décision qui associe chaque observation (vecteur de dimension N) à une des deux classes, donc à la valeur 1 ou -1.
ici N = 2 car 2 attributs

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quelle est la fonction f si nous choisissons une fonction de décision linéaire?

A

Typiquement, si nous choisissons une fonction de décision linéaire, la fonction f correspondra à la séparation de l’espace des attributs par un hyperplan (dans un espace de dimension N). Les observations se trouvant de chaque côté de l’hyperplan sera classifié 1 ou -1.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Que devient le hyperplan dans une fonction de décision si N=2 et si N=3 ?

A

Cet hyperplan devient une droite si N=2, et un plan si N=3.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

N correspond à quoi?

A

N est le nombre d’attributs

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Classification linéaire vs non-linéaire

A

Classification linéaire = Données linéairement séparables (facilement séparable par une droite)

Classification non-linéaire = Données linéairement non-séparables

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Que fait on dans les conditions de classification non-linéaire?

A

L’astuce du noyau (The Kernel Trick) = Transformer un problème de classification non-linéaire en un problème linéaire.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Apprentissage supervisé: Comment ça marche ?

A

1- phase of training
2- phase de test

1- données brutes 
2- données d'entrainement en donnant les étiquettes 
3- classification
4- test les données
5-performance en %
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

C’est quoi la Validation croisée (Cross-validation) ?

A

Répéter la procédure en changeant les sets de « training » et « test ».

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Apprentissage non-supervisé. Comment ça marche ?

A

(classification non-supervisée)
je donne tous ces points (données d’entrainement) à mon algorithme mais sans les couleurs (sans étiquettes)

il va chercher et voir qu’il y a 3 groupes (3 nuages de points)
il doit décider le point bleu appartient à quel groupe.

je ne lui ai pas dis qu’il y a 3 groupes. C’est lui qui la déterminé

17
Q

Comment appelle-t-on les techniques utilisés lors d’un apprentissage non-supervisé?

A

Clustering techniques

e.g. K-means, Hierarchical clustering

18
Q

Nommez les algorithmes de classification

A
K-th nearest neighbours (KNN) 
Linear Discriminant Analysis (LDA) 
Support Vector Machine (SVM) 
Decision trees (Arbres de décision) 
Random Forests (Forêts aléatoires) 
Artificial Neural Networks (ANN) 
\+ many more
19
Q

Expliquez l’algorithme de classification ‘‘Méthode à base de voisinage (K-th nearest neighbours, KNN) ‘’

A

L’idée est intuitive: faire voter les voisins du point de test.

1 type d’algorithme
k=5 je regarde les 5 voisins les + proches
k=20 ,, ,, 20 ,, ,,

exemple:
pour savoir dans une ville le niveau économique du point blanc. Il regarde k=9 pour savoir le point blanc, son niveau d’économie. On va pouvoir les comparer avec ses 9 voisins les + proches

Ex. k-NN classification multiclasse: “parmi mes k plus proches voisins, quelle classe est majoritaire?”

20
Q

Expliquez l’algorithme de classification ‘‘Arbre de decision: Decision trees’’

A

Plusieurs niveaux de questions dans l’arbre pour arriver à la réponse. Plusieurs décisions successives pour arriver à la réponse

21
Q

Sous-apprentissage vs. Sur-apprentissage (Underfitting vs Overfitting)

A

sur-Apprentissage = l’algorithme a trop appris. il est tellement bon sur les données d’entrainement ou données d’Apg mais avec de nouvelles données il n’est pas capable de généraliser (overfitting)
Me donne une courbe en zigzag ou une courbe qui n’est pas capable de différencier des données autre que celles similaires aux données d’apg.

sous-Apg = il a commencé à apprendre mais on a arrêté trop tôt son Apg donc il n’a pas la capacité de bien détecter (underfitting)
Me donne une ligne droite ou une ligne qui n’est pas capable de bien séparer les données car incapable de les différencier comme il faut

22
Q

Quel est l’intérêt?

A

L’intérêt qu’on a c’est de généraliser alors on s’entraîne sur les données d’Apg mais on veut appliquer cela sur des nouvelles données.

23
Q

De quoi à l’air un bon modèle?

A

une genre de courbe qui sépare les données comme il le faut

24
Q

Classification vs Regression

A

Classification = données Discrete (class labels)

Ex:
chat chien
contrôle/patient
malade/sain

Regression = données continues (values)

Ex: Nombre d’années…

25
Q

Comment faire pour savoir si un algorithme est capable de faire ce qu’il faut faire? Est-il performant ou pas?

A

il existe des Indicateurs de performance qu’il faut utiliser, il faut quantifier la performance pour la classification.

26
Q

C’est quoi la ‘‘Matrice de confusion’’?

A

C’est un indicateur de performance de Classification.

Ca nous donne la proportion des étiquettes prédites par rapport aux étiquettes réelles

Moyenne des valeurs de la diagonale pour me donner le % de classification globale indépendamment de quelle classe

Ex: moi je connais l’étiquette réelle et je vérifier si l’étiquette prédit par mon algorithme est le mm ou proche. Est ce qu’il est bon pour prédire le blues, le classique. Oh! il a de la misère a détecter le Reggae, il les mélange entre classique ou electro.
==> ceci me dit où il se trompe donc cela m’aide à améliorer ma règle ou me permet d’aller chercher une autre etiquette pour l’aider

27
Q

Quels sont les seuils de chance théorique?

A

2 classes: 50 %
4 classes: 25 %
8 classes: 12,5 %

28
Q

On doit toujours appliquer le seuil de chance théorique

A

Faux

A appliquer si nous avons beaucoup de données. La taille de l’échantillon est importante

29
Q

Quelles sont les 2 approches utilisées pour évaluer la validité statistique (significativité) de la précision de décodage obtenue (par exemple suite à la validation croisée)?

A
  • loi binomiale

- Test de permutations

30
Q

Expliquez les 2 tests statistiques

A
Loi binomiale : 
Déterminer le seuil de % de prédiction à dépasser en fonction de la valeur p et du nombre d’observation N.
(Approche paramétrique) 
On donne 3 informations
-seuil de %
-N
-p

Test de Permutations :
Générer une distribution nulle à partir des mêmes données en mélangeant aléatoirement les étiquettes. (Approche non-paramétrique)

31
Q

Apprentissage profond vs Superficiel (Shallow vs Deep Learning)

A

Apprentissage profond = l’algorithme va lui même essayer de déterminer les attributs alors on lui donne les données brutes au début. Ce type d’Apg est plus long et plus couteux en ressources (Apg d’attributs + Entrainement Model) - Attributs dérivés de la machine

Apprentissage Superficiel = Apg machine traditionnel/conventionnel (Entrainement model) Attributs déjà connu

32
Q

Qu’est ce que l’apprentissage machine nous permet-il de faire?

A

décodage cérébrale (brain decoding) qui est un outil important pour la recherche en Neuroscience (permet de faire des prédictions)

33
Q

Quelques projets de classification qui sont en cours

A
  • stades de sommeil

- Identifcation de personne (empreinte digitale)

34
Q

Pourquoi se servir de l’apprentissage machine en neurosciences ?

A
  • Données cérébrales: multi-dimensionnelles et complexes
  • Identification de « marqueurs » pertinents via leur capacité à discriminer des processus cognitifs ou conditions cliniques (diagnostique/prognostique)
  • Fouille des données (data mining) grâce à l’intelligence artificielle
  • Modélisation du traitement de l’information (ANN, RL)
35
Q

Vrai ou faux
L’utilisation des méthodes d’apprentissage machine sur des données cérébrales MEG/EEG (+ données comportementales) nous permet la mise en place de nouvelles approches d’analyses guidées par les données.

A

Vrai

36
Q

C’est quoi la MEG

A

Magnétoencéphalogramme :

37
Q

Comment formalisé l’apprentissage machine?

A

C’est le processus de sélection des paramètres de la fonction de décision.

Plus précisément, à partir d’un sous-ensemble de données d’entrainement (training set, labels connus), nous cherchons à déterminer les paramètres de la fonction de décision qui permettront une classification correcte dans le cas d’autres échantillons (données test « test set » – labels inconnus).
&laquo_space;C’est la GÉNÉRALISATION&raquo_space;