Pandas Flashcards

Question 1

Q

Pandas
- Leggere un file

Answer

A

df = pd.read_csv(Percorso)

Question 2

Q

Pandas
- Leggere un file e formattarlo

Answer

A

df = pd.read_csv(percorso, sep=”\t”, delimitar = “\n”, index_col=0)

sep –> tabulato
delimitar –> righe
index_col –> Indice prima colonna

Question 3

Q

Pandas
- Funzioni loc e iloc

Answer

A

loc = localizzazione per etichetta
iloc = localizzazione per indice

df.loc[0] = prima riga
df.loc[0:5] = prime 4 righe

Question 4

Q

Pandas
- Prime o ultime righe

Answer

A

df.head(5) –> prime 5 righe

df.tail(5) –> ultime 5 righe

Question 5

Q

Pandas
- selezionare colonne

Answer

A

df[“nome_colonna”] –> colonna specifica
df[“nome_colonna”][0:4] –> riga di colonna specifica
df[[“nome_colonna”,”nome_colonna_1”]] –> colonne specifiche

Question 6

Q

Pandas
- titoli colonne e valori

Answer

A

for key,value in df.items():
print(key) –> titoli colonne
print(value) –> valori per colonna

Question 7

Q

Pandas
- riga come scheda

Answer

A

for index,row in df.iterrows():
print(row) –> riga come scheda
print(index,row) –> aggiunge indice

Question 8

Q

Pandas
- Ordinare

Answer

A

Ordinato per indici
- df.sort_index()
- df.sort_index(ascending=false)

Ordinato per valore
- df.sort_values(by=”nome_colonna”)
- df.sort_values(by=”[nome_colonna,nome_colonna]”)
- df.sort_values(by=”[nome_colonna,nome_colonna]”, ascending=[false,true])

Question 9

Q

Pandas
- Aggiungere colonna in coda

Answer

A

colonna con i valori ‘ciao’ in coda

df[‘nome_colonna_da_aggiungere’] = ‘ciao’
df.loc[:’nome_colonna_da_aggiungere’] = ‘ciao’
df = df.assign(nome_colonna_da_aggiungere = ‘ciao’)

Question 10

Q

Pandas
- Aggiungere più colonne in coda

Answer

A

df[[‘nome_colonna_da_aggiungere’],[‘nome_colonna_da_aggiungere_1’]] = [‘ciao’,’altro’]

Question 11

Q

Pandas
-Aggiungere colonna in mezzo

Answer

A

df.insert(2,’nome_colonna_da_agg’,’ciao’)

Question 12

Q

Pandas
- Rimuovere colonne

Answer

A

3 modalità

df.drop(‘nome_colonna’,inplace=True,axis=1)
del df[‘nome_colonna’]
colPop= df.pop(‘nome_colonna’)

Question 13

Q

Pandas
- Cambiare ordine colonna

Answer

A

df.loc[:,’nome_colonna’,’nome_colonna1’]
df.iloc[:,1,4,3]

Question 14

Q

Pandas
-Invertire colonne

Answer

A

columns = list(df.columns)
columns.reverse
print(df[columns])
columns = df.columns.tolist()

Question 15

Q

Pandas
- Salvare csv o excel

Answer

A

df.to_csv(‘nome_file’,index=false)
df.to_excel(‘nome_file’,sheet_name=’nome_foglio’,index=false)

Question 16

Q

Pandas
- Filtrare dati

Answer

A

df[df[‘nome_colonna’]==’filtro’] → uguale
df[df[‘nome_colonna’]!=’filtro’] → diverso
df[df[‘nome_colonna’].str.contains=’filtro’] → contiene
df[df[‘nome_colonna’]>100] → maggiore
df[df[‘nome_colonna’]<100] → minore

Più filtri
- df(df[‘nome_colonna’]>200)&(df[‘nome_colonna’]<100)] → and

df(df[‘nome_colonna’]>200)|(df[‘nome_colonna’]<100)] → or

df.loc[(df[‘nome_colonna’]==’filtro),[‘nome_colonna’,’altra_colonna’]] → filtro con loc

Question 17

Q

Pandas
- Modificare colonne

Answer

A

Modificare una colonna

df.loc[df[‘nome_colonna’]==’vecchio_valore’,’nome_colonna’]=’nuovo_valore

Modificare + colonne

df.loc[df[‘nome_colonna’]==’vecchio_valore’,[‘nome_colonna1’,’nome_colonna2’]]=[‘nuovo_valore1’,’nuovo_valore2’]

Question 18

Q

Pandas
- Unire più liste

Answer

A

pd.concat([df1,df2,df3],axis=1]

Question 19

Q

Pandas
- Raggruppare

Answer

A

types = df.groupby(‘nome_colonna’)

print(types.groups) → elenco gruppi

Raggruppare più gruppi
types = df.groupby[‘nome_colonna’,’nome_colonna1’]

for name,group in types:
print(name) → mostra nomi gruppi
print(group) → mostra elenco gruppi

Question 20

Q

Pandas
- Statistiche gruppi

Answer

A

types =
1 - df.groupby(‘nome_colonna’).mean()
2 - df.groupby(‘nome_colonna’).sum()
3 - df.groupby(‘nome_colonna’).min()
4 - df.groupby(‘nome_colonna’).max()
5 - df.groupby(‘nome_colonna’).count()

Funzioni importanti
.isnull().sum()
.endswith(‘ID’)
.drop([‘nome_col’],axis=1)
.value_counts(ascending=True)

Question 21

Q

Pandas
- Pulire i dati

Answer

A

Eliminare i dati

new_df = df.dropna()
df.dropna(inplace=True)

Scambiare i vuoti

df.fillna(‘new_valore’, inplace= True)
df[‘nome_colonna].fillna(‘new_valore’,inplace=True)
df[‘nome_colonna].fillna(df[‘nome_colonna’].mean(),inplace=True) → cambiato con media valore

Cambio formato

-df[‘nome_colonna]=pd.to_date_time(df[‘nome_colonna])

RImuovere duplicati

df.dropduplicates(inplace=True)

Question 22

Q

Pandas
- Dati errati

Answer

A

Cambiare un valore
df.loc[‘valore_da_cambiare’,’nome_colonna’]=’nuovo_valore’

Cambiare più valori

if df.loc[index,’nome_colonna’]>60:
df.loc[index,’nome_colonna’]=5

Question 23

Q

Pandas
- EDA

Answer

A

df.describe() → trasposto df.describe.T

df.info()

df.index()

Question 24

Q

Pandas
- Modificare testo

Answer

A

df.replace(‘/’,’_’) → cambiare valori
df.lower() → minuscolo
df.upper() → maiuscolo
df.columns[lista nomi colonne]

Question 25

Q

Pandas
- Merge

Answer

A

df_new = pd.merge(df,df1)
df_new = pd.merge(df,df1, how=’outer’)
df_new = pd.merge(df,df1,on=’nome_colonna’)
df_new = pd.merge(df,df1,left_on=’col1’, right_on=’col2’,how=’outer’).drop(‘col’,axis=1)

Question 26

Q

Pandas
- Multiindici (da tuples)

Answer

A

index = [(‘Giuliano’,2000),(‘Giuliano,2020),(‘Laura’,2000),(‘Laura’,2020)]

index = pd.MultiIndex.from_tuples(index)

df.index = index

df[‘Giuliano’]
df[:,2000]
df[:,2000].mean()
df.unstack