Cours 11 Flashcards
Qu’est-ce que l’apprentissage : position des béhavioristes
- une modification du comportement du sujet
- plus ou moins durable
- résultant de l’expérience du sujet
- impliquant une connexion entre au moins deux stimuli (tout est basé sur les choses qui sont pairés ensembles)
En fin de session, nous pouvons réviser notre définition de l’apprentissage pour la rendre conforme aux découvertes faites par les cognitivistes, l’apprentissage serait donc :
- une modification du comportement du sujet
- Impliquant la mémoire à long terme et la mémoire de travail
- résultant de l’acquisition de connaissances
- impliquant la connexion d’au moins 2 éléments d’informations
Qu’est-ce que l’apprentissage machine?
L’apprentissage automatique est un champ d’étude de l’intelligence artificielle, concernant la conception, l’analyse, le développement et l’implémentation de méthodes permettant à une machine d’évoluer par un processus systématique et ainsi de remplir des tâches difficiles ou problématiques par des moyens algorithmiques plus classiques
Liens ordinateurs - êtres humains
Les ordinateurs font exactement ce que nous faisons
Être humain = machine biologique
Pedro Domingos - comparaison apprentissage machine au jardinage
Les algorithmes seraient comme des graines (algorithmes est ce qui permet au système de fonctionner)
Les données (le vécu, l’expérience) joueraient le rôle d’engrais
Le chercheur/ingénieurs (prend un être humain) serait le jardinier
Les programmes/applications développés seraient les fruits de ce jardinage
Machine : complète cycle : apprentissage (le fruit), mais il faut donner un algorithme.
Apprentissage supervisé
Les données d’apprentissage contiennent aussi des informations sur le résultat visé.
L’objectif est parfaitement décrit : “je sais ce que je veux, je te donne les données et l’objectif”. ça va donner ce que l’on veut, mais ce n’est pas forcément la bonne chose en termes de recherche
Apprentissage semi-supervisé
les données d’apprentissage contiennent quelques informations sur le résultat visé.
Utile pour psycho : une idée de ce que je veux, pas certain exactement, mais je veux que ça soit ça à peu près.
Apprentissage non-supervisé
les données d’apprentissage ne contiennent pas d’information sur le résultat visé.
On ne sait pas ce que l’on cherche. Exemple : astronomie : on ne sait pas vraiment ce que l’on cherche.
Apprentissage par renforcement
une forme de récompense est obtenue suite à une séquence d’actions.
Peut servir dans les 3 autres cas, une récompense peut rester importante : c’est une motivation.
Avec apprentissage semi-supervisé et non supervisé : il est possible de faire + de découverte.
Apprentissage supervisé +
Ce type d’apprentissage automatique est utilisé si des exemples de données sont disponibles et permettent d’identifier à l’avance les catégories. On parle de processus d’étiquetage, fait généralement par un expert (humain). Une fois le modèle construit, il est testé en classant de nouvelles données et en validant l’exactitude de cette classification automatique.
Apprentissage semi-supervisé +
Comme l’apprentissage automatique de type non-supervisé, l’AA semi-supervisé est utilisé pour identifier la structure sous-jacente des données, mais dans le cas ou il manque des données ou des étiquettes, et non pas en cas de totale absence.
Apprentissage non-supervisé +
Ce type d’AA est utilisé si les exemples disponibles ne permettent pas de déterminer les catégories (c’est-à-dire les étiquettes).
On parle souvent de « clustering »
Le système d’intelligence artificiel doit alors identifier la structure sous-jacente des données lui-même en utilisant divers algorithmes appropriés
Apprentissage par renforcement
Dans ce type d’AA, on cherche à identifier les actions qu’un agent (type de logiciel intelligent) doit agir dans un environnement donné afin de maximiser à long-terme la récompense.
Une particularité de ce type de AA est que l’agent intelligent ne se fait pas montrer quoi faire et ses réponses sous-optimales ne sont pas corrigées par une source externe.
Le cerveau de l’AA : des algorithmes spécialisés
L’apprentissage automatique repose sur le développement d’algorithmes spécialisés.
Il en existe déjà un nombre énorme et chaque année, on en découvre/invente des dizaines supplémentaires
- Dans son article de 2012 intitulé « a few useful things to know about machine learning”, Professeur Pedro Domingos propose tout algorithme d’apprentissage machine possède 3 composantes :
1. Une méthode de représentation
2. Une méthode d’évaluation
3. Une méthode d’optimisation
(« Learning = representation + evaluation + optimization”)
Représentation
La représentation est essentiellement l’espace des modèles possibles (l’espace des hypothèses), mais tient également compte du fait que nous exprimons ces modèles dans un langage formel qui peut encoder certains modèles plus facilement que d’autres (même dans cet ensemble possible). Cela s’apparente au paysage des modèles possibles, le terrain de jeu permis par une représentation donnée.