Cours 9 Flashcards
Qu’est-ce qui compose la renaissance de l’IA?
Big data + Puissance de calcul
Les algorithmes d’avant, pour atteindre une bonne performance il fallait beaucoup de données, ce qui n’était pas disponible avant –> maintenant possible avec la masse de données d’aujourd’hui(Internet)
Ces algorithmes demandent beaucoup de puissance de calcul, qui n’était pas disponible avant non plus
Liens entre IA, apprentissage machine et apprentissage profond
IA –> Machine Learning –> Deep learning
Définition d’apprentissage machine
Il s’agit d’algorithmes informatiques qui analysent un ensemble de données afin de déduire des règles qui constituent de nouvelles connaissances permettant d’analyser de nouvelles situations.
La machine suit les règles que le programmeur à donner (Si ca sa arrive, fait ca)
On dit à la machine d’Apprendre la règle par exemple on dit 400000 exemplaires de chats et chiens et ont demande d’apprendre la règle derrière qu’Est-ce qu’un chat
Quels sont les fonctions de l’Apprentissage machine?
Prédire et classifier
Prédire une évolution
- Une évolution d’une maladie (ex. vers une démence, de MCI vers Alzheimer)
- Ex : Youtube tente de prédire les videos qu’on va aimer selon ce qu’on a déjà aimer ou sinon la météo qui se fit sur la température des 10 dernières années
Classifier (catégoriser)
- Patients vs Patients (ex. Identifier des sous-groupes, ou différencier deux groupes de patients, ex. Schizophrénie vs. bipolarité)
- Présence ou non d’une lésion sur une image IRM selon des images qui sont non pathologiques
Qu’est-ce que l’apprentissage supervisée?
Les données sont labélisées (classes prédeterminées)
On dit la réponse à la machine pour qu’elle se fasse une règle (Supervisée) et ensuite on test avec d’Autres données voir si il a appris
On entraine le classifieur avec des données
Une fois qu’il a appris, on lui donne des données tests et on regarde ses prédictions avec ce qu’il a appris
Quelle est l’autre méthode qu’on peut faire au lieu de donner des données brutes?
Desfois, on peut donner de l’extraction d’attributs = à partir des données au lieu de donner les données brutes, on extrait les paramètres de chacun et on donne les paramètres à la machine
L’activité cérébrale devient les données et on peut demander à la machine de différencier les deux patrons d’Acitivités et de trouver quel cerveau écoute quelle musique
Extraction d’Attributs : Différencier les puissances à travers les différentes structures, les erps
Qu’est-ce que le problème de classification à deux classes (Classification binaire)
Un classifieur binaire (à 2 classes) peut être formalisé comme une fonction de décision
Qui associe chaque observation (vecteur de dimension N) à une des deux classes, donc à la valeur 1 ou -1.
On veut qu’il apprenne une règle de classification qui va différencier si la personne est attentive ou inattentive (Ici la droite est la règle apprise par l’Algorithme) (La droite est la fonction de décision)
Qu’est-ce que la généralisation?
À partir de ce que la machine a appris selon l’information qu’on lui a donnée, elle va extraire une règle et ensuite généraliser les choses qu’elle a apprit pour de nouvelles données
Différence entre données linéairement séparables et linéairement non-séparables
Linéairement séparable : facilement séparable
Non-séparable : Pas possible d’utiliser un modèle linéaire pour séparer les point
On fait un arbre de décision avec de multiples droites (Multiples fonctions de décision) qui fait en sorte qu’il y a 2 classes au finales :
• Ce qui est à droite de cette droite est jaune et à gauche bleue
• Etc.
Que fait l’Astuce du noyau?
Il transforme un problème non-linéaire à linéaire avec des règles mathématiques
Comment se passe le processus de tester des données et les problèmes associés
On coupe les données en deux, tests et entrainement
2 phases
• Phase de d’Entrainement
• Phase de test
Problèmes possibles :
• Qualités des données
• Reproduction sur d’Autres données
• Contexte selon la % obtenu
• Peut – etre le 80% de données d’entrainement qui a été pris a donner 88% de performance, mais qu’un autre 80% va donner 68%
o On fait plusieurs essais avec 80% et ensuite on fait la moyenne de tout les essais Validation croisée
Qu’est-ce que l’apprentissage non-supervisée
Ici on donne pas de feedback, mais on dit il y a deux groupes et l’algorithme se débrouille avec les données globales
Les données ne sont pas labélisées (Les classes/categories seront determinées par l‘algorithme à partir des données)
Qu’est-ce que la méthode à base de voisinage?
On regarde les voisin du points
Parmi les voisins, lequel est majoritaire?
Si plus de rouge, il devrait donc être rouge
9 voisins donc K=9
Qu’est-ce que la méthode de la arbre de décision?
Découpe le problème en multiple décisions à suivre qui vient préciser l’item qu’on cherche
Différence entre sur-apprentissage, sous-apprentissage et le good model
Sur-apprentissage : overfitting
o Règle de décision trop spécifique donc généralise pas bien à de nouvelles données
Sous-apprentissage : underfitting
o Ne capture pas assez la nuance entre deux groupes
Good model :
o Bonne clasification sur les points et la frontière permet d’Avoir de bonne réponses sur de nouvelles données