Pandas Flashcards

1
Q

Pandas
- Leggere un file

A

df = pd.read_csv(Percorso)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Pandas
- Leggere un file e formattarlo

A

df = pd.read_csv(percorso, sep=”\t”, delimitar = “\n”, index_col=0)

  • sep –> tabulato
  • delimitar –> righe
  • index_col –> Indice prima colonna
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Pandas
- Funzioni loc e iloc

A

loc = localizzazione per etichetta
iloc = localizzazione per indice

df.loc[0] = prima riga
df.loc[0:5] = prime 4 righe

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Pandas
- Prime o ultime righe

A

df.head(5) –> prime 5 righe

df.tail(5) –> ultime 5 righe

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Pandas
- selezionare colonne

A

df[“nome_colonna”] –> colonna specifica
df[“nome_colonna”][0:4] –> riga di colonna specifica
df[[“nome_colonna”,”nome_colonna_1”]] –> colonne specifiche

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Pandas
- titoli colonne e valori

A

for key,value in df.items():
print(key) –> titoli colonne
print(value) –> valori per colonna

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Pandas
- riga come scheda

A

for index,row in df.iterrows():
print(row) –> riga come scheda
print(index,row) –> aggiunge indice

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Pandas
- Ordinare

A

Ordinato per indici
- df.sort_index()
- df.sort_index(ascending=false)

Ordinato per valore
- df.sort_values(by=”nome_colonna”)
- df.sort_values(by=”[nome_colonna,nome_colonna]”)
- df.sort_values(by=”[nome_colonna,nome_colonna]”, ascending=[false,true])

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Pandas
- Aggiungere colonna in coda

A

colonna con i valori ‘ciao’ in coda

  • df[‘nome_colonna_da_aggiungere’] = ‘ciao’
  • df.loc[:’nome_colonna_da_aggiungere’] = ‘ciao’
  • df = df.assign(nome_colonna_da_aggiungere = ‘ciao’)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Pandas
- Aggiungere più colonne in coda

A

df[[‘nome_colonna_da_aggiungere’],[‘nome_colonna_da_aggiungere_1’]] = [‘ciao’,’altro’]

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Pandas
-Aggiungere colonna in mezzo

A

df.insert(2,’nome_colonna_da_agg’,’ciao’)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Pandas
- Rimuovere colonne

A

3 modalità

  • df.drop(‘nome_colonna’,inplace=True,axis=1)
  • del df[‘nome_colonna’]
  • colPop= df.pop(‘nome_colonna’)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Pandas
- Cambiare ordine colonna

A

df.loc[:,’nome_colonna’,’nome_colonna1’]
df.iloc[:,1,4,3]

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Pandas
-Invertire colonne

A
  • columns = list(df.columns)
    columns.reverse
    print(df[columns])
  • columns = df.columns.tolist()
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Pandas
- Salvare csv o excel

A
  • df.to_csv(‘nome_file’,index=false)
  • df.to_excel(‘nome_file’,sheet_name=’nome_foglio’,index=false)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Pandas
- Filtrare dati

A
  • df[df[‘nome_colonna’]==’filtro’] → uguale
  • df[df[‘nome_colonna’]!=’filtro’] → diverso
  • df[df[‘nome_colonna’].str.contains=’filtro’] → contiene
  • df[df[‘nome_colonna’]>100] → maggiore
  • df[df[‘nome_colonna’]<100] → minore

Più filtri
- df(df[‘nome_colonna’]>200)&(df[‘nome_colonna’]<100)] → and

df(df[‘nome_colonna’]>200)|(df[‘nome_colonna’]<100)] → or

df.loc[(df[‘nome_colonna’]==’filtro),[‘nome_colonna’,’altra_colonna’]] → filtro con loc

17
Q

Pandas
- Modificare colonne

A

Modificare una colonna

df.loc[df[‘nome_colonna’]==’vecchio_valore’,’nome_colonna’]=’nuovo_valore

Modificare + colonne

df.loc[df[‘nome_colonna’]==’vecchio_valore’,[‘nome_colonna1’,’nome_colonna2’]]=[‘nuovo_valore1’,’nuovo_valore2’]

18
Q

Pandas
- Unire più liste

A

pd.concat([df1,df2,df3],axis=1]

19
Q

Pandas
- Raggruppare

A

types = df.groupby(‘nome_colonna’)

print(types.groups) → elenco gruppi

Raggruppare più gruppi
types = df.groupby[‘nome_colonna’,’nome_colonna1’]

for name,group in types:
print(name) → mostra nomi gruppi
print(group) → mostra elenco gruppi

20
Q

Pandas
- Statistiche gruppi

A

types =
1 - df.groupby(‘nome_colonna’).mean()
2 - df.groupby(‘nome_colonna’).sum()
3 - df.groupby(‘nome_colonna’).min()
4 - df.groupby(‘nome_colonna’).max()
5 - df.groupby(‘nome_colonna’).count()

Funzioni importanti
.isnull().sum()
.endswith(‘ID’)
.drop([‘nome_col’],axis=1)
.value_counts(ascending=True)

21
Q

Pandas
- Pulire i dati

A

Eliminare i dati

  • new_df = df.dropna()
  • df.dropna(inplace=True)

Scambiare i vuoti

  • df.fillna(‘new_valore’, inplace= True)
  • df[‘nome_colonna].fillna(‘new_valore’,inplace=True)
  • df[‘nome_colonna].fillna(df[‘nome_colonna’].mean(),inplace=True) → cambiato con media valore

Cambio formato

-df[‘nome_colonna]=pd.to_date_time(df[‘nome_colonna])

RImuovere duplicati

df.dropduplicates(inplace=True)

22
Q

Pandas
- Dati errati

A

Cambiare un valore
df.loc[‘valore_da_cambiare’,’nome_colonna’]=’nuovo_valore’

Cambiare più valori

if df.loc[index,’nome_colonna’]>60:
df.loc[index,’nome_colonna’]=5

23
Q

Pandas
- EDA

A

df.describe() → trasposto df.describe.T

df.info()

df.index()

24
Q

Pandas
- Modificare testo

A
  • df.replace(‘/’,’_’) → cambiare valori
  • df.lower() → minuscolo
  • df.upper() → maiuscolo
  • df.columns[lista nomi colonne]
25
Q

Pandas
- Merge

A
  • df_new = pd.merge(df,df1)
  • df_new = pd.merge(df,df1, how=’outer’)
  • df_new = pd.merge(df,df1,on=’nome_colonna’)
  • df_new = pd.merge(df,df1,left_on=’col1’, right_on=’col2’,how=’outer’).drop(‘col’,axis=1)
26
Q

Pandas
- Multiindici (da tuples)

A

index = [(‘Giuliano’,2000),(‘Giuliano,2020),(‘Laura’,2000),(‘Laura’,2020)]

index = pd.MultiIndex.from_tuples(index)

df.index = index

df[‘Giuliano’]
df[:,2000]
df[:,2000].mean()
df.unstack