Pandas commands Flashcards
Commandes pour retrouver les types des colonnes ?
df.dtypes
Comment récupérer la liste des méthodes possibles d’un objet ?
dir(pd.Series)
Nombre d’occurences par valeurs d’une série ?
ma_serie.value_counts()
3 façons d’avoir la taille d’une Serie
len(serie) ou serie.shape ou serie.size
Nombre de non-missing values d’une serie ?
serie.count()
Quantiles d’une serie ?
serie.quantile(0.3) ou serie.quantile([0.2, 0.8])
Comment trouver les valeurs manquantes d’une série ?
serie.isnull() (renvoit une liste de booléen)
Remplir les valeurs manquantes d’une série ?
serie.fillna(0)
Supprimer les valeurs manquantes d’une série ?
serie.dropna()
Tester si une série a des valeurs manquantes
serie.hasnans
Définir la colonne qui sera l’index d’un dataframe
df.set_index(‘colonne’)
Défininr la colonne qui sera l’index d’un dataframe, au moment où on lit le csv
pd.read_csv(‘truc.csv’, index_col=’colonne’)
Remettre l’index un dataframe en colonne
df.reset_index()
Renommer colA en colB
df.rename({‘colA’: ‘colB’})
Supprimer une colonne
df.drop(‘colA’, axis=’columns’)