Fonctions Data Flashcards

1
Q

Pivoter un data frame

A

Df.pivot()

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Pour fusionner un data frame

A

Df.merge()

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Pour lire un Excel depuis pandas

A

Df.read_excel()

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

D’après Wikipédia c’est quoi la data science

A

Extraction de connaissances à partir d’ensemble de données

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Lemmatisation et racinisation

A
  • Lemmatisation = réduit les mots à leur forme canonique
  • racinisation = réduit le mot à leur racine
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Récupérer les infos d’un data frame

A

Data.infos()

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quelles sont les méthodes du machine Learning

A
  • régression = prédire une valeur continue
  • classification = prédire une catégorie ou une classe
  • clustering = utilisées en APPRENTISSAGE NON SUPERVISÉ pour regrouper les données similaires
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Types de régression + le rôle ?

A

—> prédire une valeur continue
- régression linéaire : relation linéaire entre les variables explicatives et la variable cible
- régression polynomiale : relation non linéaire en ajoutant des puissances de variable
- régression rigide et lasso : ajout de régularisation et éviter le SURAPPRENTISSAGE

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quels sont les modèles pour la classification + rôle

A

—> prédiction du groupe ou de la classe
- KNN
- classification bayesienne
- réseaux de neurones
- arbre de décision

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quels sont les modèles pour le clustering + rôle

A

—> regrouper les données similaires
- K-Means
- DBSCAN
- Hierarchical clustering

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Réseaux de neurones rapide ou lent, précis ou imprécis ?

A
  • très précis mais plus de temps de calcul
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Selon iels critères ont choisit le modèle de prédiction

A
  • nature de la variable cible
  • taille et complexité des données
  • interpretabilité (arbre de décision meilleur que le réseau de neurone)
  • précision et rapidité
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Avantages / défauts de la classification bayesienne

A

+ rapide, simple à implémenter, fonctionne bien avec des données à haute dimension
- hypothèse d’indépendance irréaliste

How well did you know this?
1
Not at all
2
3
4
5
Perfectly