cours 9 Flashcards
1
Q
la science des données: domaine multidiscipliaire
A
- Au centre, nous retrouvons data science et autour nous avons : hacker mindset, statistics, math, advanced computing, data engineering, domain expertise, scientific method et visualization
2
Q
apprentissage supervisé: comment ça marche?
A
- Entre le classifieur et les données test, il y a une phase de test où est-ce qu’on utilise la validation croisée. On va répéter la procédure en changeant les sets de training et de test avec une répartition de 80/20.
- Le choix de l’algorithme est dans les mains du chercheur qui peut choisir entre le KNN, SVM, LDA, NB, etc.
3
Q
loi binomiale
A
o Déterminer le seuil % de prédiction à dépasser en fonction de valeur de p et du nombre d’observations N
4
Q
test de permutations
A
o Générer une distribution nulle à partir des mêmes données en mélangeant aléatoirement les étiquettes
5
Q
shallow vs deep learning
A
- Shallow: on a un modèle qui est simple et qui a une capacité limitée d’apprendre des patrons complexes des données (ex : KNN, arbres de décision, régression, support vector machine (SVM)). On fait une extraction manuelle des attributs
- Deep: utiliser des networks neuronaux avec plusieurs couches pour apprendre, automatiquement, des patrons complexes et des représentations des données
o Démontrer dans la reconnaissance d’images et parole, processus langagiers et dans les jeux
o Ex : CNN, RNN
o Extraction des données hiérarchiquement
6
Q
pourquoi se server de l’apprentissage machine en neurosciences?
A
- Données cérébrales : multi-dimensionnelles et complexes
- Fouille des données (data mining) grâce à l’IA
- Identification de marqueurs pertinents via leur capacité de discriminer des processus cognitifs ou conditions cliniques
o Ex : indiquer que le cortex préfrontal est impliqué dans les cas de schizophrénie (rapporter ceci aux cliniciens et non le decoding accuracy %) - Modélisation du traitement de l’information (ANN, RL) – faire la comparaison entre les humains et l’IA
7
Q
A