Cours 11 Flashcards
AI définition :
Développement de systèmes et de machines intelligents capables d’effectuer des tâches qui nécessiteraient autrement l’intelligence humaine.
Apprentissage machine (ML) : définition
- Sous-catégorie de l’AI.
Création d’algorithmes capables d’apprendre à partir des données fournies et de prendre des décisions en fonction des modèles observés dans ces données.
Apprentissage profond (DL) : définition
- Sous-catégorie
supplémentaire du ML.
Il utilise un réseau neuronal artificiel pour traiter les données à travers différentes couches d’algorithmes et parvenir à une décision précise sans intervention humaine.
Importance de l’apprentissage machine :
outils puissants pour analyser et comprendre les comportements humains.
-identifier des schémas comportementaux complexes
-prédire les comportements futurs en fonction de variables psychologiques pertinentes
-d’automatiser des tâches telles que l’analyse de textes pour extraire des informations sur les sentiments ou les émotions des individus.
Qu’est-ce que l’apprentissage supervisé ? Et l’apprentissage non-supervisé ?
utilisation de données étiquetées pour entraîner un modèle à prédire des résultats futurs (ex : prédire diagnostic selon performances aux tests cognitifs)
trouver des schémas ou des structures cachées dans les données sans utiliser d’étiquettes préexistantes
Qui suis-je ?
Un agent apprend à prendre des décisions en interagissant avec un environnement.
apprentissage par renforcement
L’agent effectue des actions, et en fonction de ces actions, l’environnement fournit des retours sous forme de récompenses ou de pénalités.
L’objectif de l’agent est d’apprendre une politique qui maximise la récompense cumulative au fil du temps.
Manière de nettoyer et de préparer les données :
- valeurs aberrantes ou manquantes
- la normalisation des données pour les mettre à la même échelle
- la conversion des variables catégorielles en formats appropriés pour l’analyse
- divisées en ensembles d’entraînement et de test pour évaluer la performance des modèles
**éviter le surajustement
Modèles les plus simples et plus utilisés en psychologie pour prédire une variable continue en fonction de variables indépendantes, qui suis-je ?
La régression linéaire
Objectif de la régression linéaire ?
Obtenir une équation qui minimise l’erreur entre les valeurs prédites et les valeurs observées, ce qui permet de faire des prédictions sur de nouvelles données.
L’objectif est de trouver les bêtas qui minimisent l’erreur de prédiction.
Qui suis-je ? Largement utilisé en psychologie, mais qui s’applique lorsque la variable cible est catégorique :
Quel est son objectif ?
la classification
L’objectif de la classification est d’assigner des étiquettes ou des catégories à des données basées sur leurs caractéristiques.
Définition clustering :
- former des groupes de points de données homogènes à partir d’un ensemble de données hétérogènes.
○ Il évalue la similarité en fonction d’une métrique
et regroupe ensuite les points ayant le score de similarité le plus élevé ensemble.
Taux de vrai positif (sensibilité) et taux de faux positif (spécificité). Quelles sont les formules ?
true positive/(true positive + false négative)
false positive/(false positive + true negative)
Qu’est-ce que le sur-ajustement et le sous-ajustement ?
Sur-ajustement (Overfitting) :
Le modèle est trop complexe par rapport à la quantité de données disponibles, ou lorsqu’il est entraîné pendant trop longtemps.
Sous-ajustement (Underfitting):
Le modèle est trop basique ou lorsqu’il n’est pas entraîné suffisamment longtemps pour capturer les tendances dans les données.
Exemple d’application de l’apprentissage machine :
Analyse de sentiment et classification de textes
prédire les comportements futurs en se basant sur des données observationnelles sur le comportement passé
utilisés pour fournir un contenu éducatif ou thérapeutique personnalisé en fonction des besoins individuels des apprenants ou des patients.
Qu’est-ce qu’un réseau de neurones profonds ?
- Multiples couches de neurones interconnectés.
○ Effectuant chacune des opérations de transformation.
Pour la transmettre à l’autre. - Capacité d’apprendre des représentations hiérarchiques des données
caractéristiques complexes et abstraites à différents niveaux d’abstraction.
Quelle est la première couche du réseau ? Elle fait quoi ?
la couche d’entrée
elle reçoit les donnéesbrutes en entrée
Qu’est-ce que les couches cachées ?
- Intermédiaires entre la couche d’entrée et la couche de sortie.
Extraction des caractéristiques des données en effectuant des transformations non linéaires.
Quelle est le nom de la dernière couche du réseau ? Elle produit quoi ?
la couche de sortie
elle produit les prédictions ou les résultats du modèle
La couche de sortie peut avoir des neurones correspondant à chaque classe possible
Propagation avant
Les données d’entrée sont ____ à travers le réseau, couche par couche, en effectuant des ___de pondération et de biais. Les prédictions du modèle sont obtenues à partir de la ____
propagées
calculs
sortie de la couche de sortie.
Comment fait-on le calcul de l’erreur ?
L’erreur du modèle est calculée en comparant les prédictions du modèle avec les valeurs réelles des données d’entraînement à l’aide d’une fonction de perte.
Rétropropagation de l’erreur
L’erreur est propagée ____ à travers le réseau, de la couche de sortie à la couche d’entrée, afin de calculer les ____ par rapport aux poids et aux __de chaque neurone.
en arrière
gradients de perte
biais
Comment est fait la mise à jour des poids ?
Les poids et les biais du réseau sont ajustés dans la direction qui minimise la fonction de perte, en utilisant des algorithmes d’optimisation tels que la descente de gradient stochastique.
Utilisés pour la vision par ordinateur, les ____ sont composés de couches de convolution et de sous-échantillonnage qui permettent d’extraire des caractéristiques spatiales des images.
CNN (réseaux de neurones convolutifs)
Les réseaux de neurones récurrents (RNN) sont utilisés pour faire quoi ?
Utilisés pour le traitement de séquences, les RNN sont capables de traiter des données séquentielles en conservant une mémoire à court terme grâce à des boucles récurrentes.
Une architecture de réseau plus récente, utilisée principalement pour le traitement du langage naturel, les ____ sont basés sur des mécanismes d’attention qui permettent au modèle de focaliser son attention sur différentes parties de la séquence d’entrée.
transformers
Les grands modèles de langage (LLM)
Entraînés à prédire le ____ suivant un texte fourni en ___
Permet de développer une riche ___ avec l’utilisateur et de _____ de l’information à partir d’un grand corpus de texte.
Ces modèles ont encore de la difficulté avec les tâches de la _____
Mais ils présentent des performances très supérieures aux tests de ___, peuvent passer les examens du ___ et très avancés en ____
mot
entrée
interaction
synthétiser
théorie de l’esprit
QI
barreau
médecine
Apprentissage profond biofeedback est une méthode thérapeutique qui permet à une personne de recevoir en temps réel des _____ sur des paramètres _____.
Ces infos peuvent être utilisées pour apprendre à ____ ces paramètres de manière ____, souvent dans le but d’améliorer la ___ ou les _____
informations
physiologiques
(fréquence cardiaque, tension artérielle, temp corporelle)
contrôler
consciente
santé
performances