2-cours9_IA Flashcards
terme le + large:
intelligence artificielle
sous catégorie de l’apprentissage machine:
deep learning (apprentissage profond)
but de l’intelligence artificielle:
essayer de copier l’intelligence humaine dans une machine
courriel spam c’est qyoi
aprentissage machien
ordre de l’IA:
deep learning dans machione learning dans IA
la manioulation de données, c’est la:
data science
synonyme de apprentissage machine:
apprentissage AUTOMATIQUE
Apprentissage STATISTIQUE
MCHINE LEARNING
Il s’agit d’algorithmes informatiques qui analysent un ensemble de données afin de déduire des règles qui constituent de nouvelles connaissances permettant d’analyser de nouvelles situations.
apprentissage machine
je donne des regles à la machine: qd je dis ca tu répond ca
algorithme
2 items dans apprentissage machine: prédire:
1) prédire une évolution
2) Classifier
2 types d’apprentissage: apprentissage supervisée et non-supervisée
ok
classes sont prédéterminées et les données labélisées. je te dis ça c un chien ca c’est un chat
apprentissage SUPERVISÉe
données ne sont pas labélisées. les classes/catégories seront déterminées par l’algorithme à partir des données
Apprentissage non supervisé
quelles données qd on entraine l’algorithme, algorithme qui a encore rien appris
données d’entrainement
données qui ne faisaient pas partie des données d’entrainement, jamais vues par algorithme. on regarde s’il est capable d’avoir une bonne prédiction et modèle fonctionne. Algorithme généralise au dela des données d’apprentissage
données test
algorithme capable de généraliser??
OUIII
Dans les algorithmes, on entraine quoi?
classifieur
Classifieur est à la base de quoi?
d’une algorithme
on fait quoi qd on met des données tests dans le classifieur (modèle? ?
de sprédictions
on extraie l’extraction d’attributs de quoi?
signal brut
DA = 75% c’est quoi?
précision/acquité de décodage
classification à 2 classes:
classification binaires
un classificateur binaire peut ê formalisé comme une focntion de __?
décision qui associe chaque observation (vecteur de dimension N) à une des 2 classes, donc à la valeur 1 ou -1
le choix de la fct de décision se limite à une famille de fcts fixée par
le chercheur
si on choisit une fct de décision linéaire, la fonction f correspond à quoi?
séparation de l’espace des attributs par un hyperplan (dans un espace de dimension N). les observations se trouvant de chaque côté de l’hyperplan sera classifié 1 ou -1
décision linéaire. séparation de l’espace des attributs par un hyperplan (dans un espace de dimension N). les observations se trouvant de chaque côté de l’hyperplan sera classifié
1 ou -1 (état attentif ou distrait)
le processus de sélection des paramètres de la
fonction de décision.
apprentissage
2 types de classification:
classificaion linéaire et non-linéaire
Transformer un problème de classification non
non-linéaire en un problème linéaire.
Astuce du noyau (kernel trick)
LDA, SVM, KNN, NB sont des ?
algorithmes
apprentissage non-supervisé: clusterinig techniques comme:
k-means et hierarchical clustering
algorithme regarde les données ous différents angles, trouve mettons 3 parterres qui ressortent, va faire 3 catégories
clustering techniques apperntissage non-supervisé
L’idée est intuitive: faire
voter les voisins du point
de test.
Ex. k
k-NN classification
multiclasse : “parmi mes k
plus proches voisins,
quelle classe est
majoritaire?”
méthode à base de voisinage
Classification
Accuracy
▪
Logarithmic
Loss
▪
Area Under ROC
Curve
▪
Confusion Matrix
▪
Classification Report
sont des indicateurs de performance pour:
classification
Mean Absolute Error.
▪
Mean Squared Error.
▪
R^2.
sont des indicaeurs de performance pour la
régression
matrice de confusion diagonal:
prédiction sans erreur
seuils de chance théorique:
4 classes: 25%
8 classes: 12.5%
Pour évaluer la validité statistique (significativité) de la précision de décodage
Decoding accuracy , DA) obtenue (par exemple suite à la validation croisée), deux
approches sont souvent utilisées: (2 familles de tests statistiques)
loi binominale et test de permutations
quelle famille de tests statistiques: Déterminer le seuil de % de
prédiction à dépasser en
fonction de la valeur p et du
nombre d’observation N. approche paramétrique
loi binomiale
quel famille de tests statistiques? Générer une distribution nulle
à partir des mêmes données
en mélangeant aléatoirement
les étiquettes.
approche non paramtrique:
test de permutations
loi binomiale et test de permutations paramétrique ou non?
Loi binomiale: approche paramétrique
Test de permutations: approche non-paramétrique
Déterminer le seuil de % de
prédiction à dépasser en
fonction de la valeur p et du
nombre d’observation N
loi binomiale
Générer une distribution nulle
à partir des mêmes données
en mélangeant aléatoirement
les étiquettes.
test de permutations
différence enter shallow et deep learning
Shallow Learning often refers to traditional/conventional machine learning pipeline:
problem-specific feature extraction -> model training
Deep Learning often refers to a lengthier and more computationally expensive machine learning pipeline:
Feature Learning + Model Training (usually done together)
les features sont dérivées du data dans shallow ou deep learning?
deep learning
hand-crafted features dans shallow ou deep learning?
shallow
living portraits (prortraits d’une personne vivante comme la mona lisa) exemple de quoi?
convolutional neural networks
apprentissage machine est un outil pour avancer notre compréhension des fonctions et
disfonctions du cerveau
comment AI aide neuroscience?
- reverse engineering the brain (refaire les strcutres du cerveau artificiellemetn
- outil de data mining (perceptions, imagerie mentale, intentions, décisions, émotions…
Apprentissage machine permet d’identifier les marqueurs pertiennts via leur capacité à discriminer des processus cognitifs ou conditions cliniques
modélise le traitement de l’info
permetune fouille de données (data minign)