Pandas Flashcards
Create a new DataFrame
df = pd.DataFrame() (Atenção com as maiúsculas!)
parâmetro axis=0
eixo x
parâmetro axis=1
eixo y
selecionar colunas W e Z do dataframe
df[[‘W’,’Z’]]
cria coluna nova no dataframe
df[‘new’] = df[‘W’] + df[‘Y’]
Algo to cut the lines of the DataFrame up to a value
Find the line index using line= df.loc[df[‘COL’] == ‘Limite’].index.min()
df = df[df.index < line]
Cut the columns on a DataFrame
col_names = [‘Data’, ‘A’]
df = df[col_names]
Caps Lock no nome das colunas
df.columns = df.columns.str.upper()
Substituir nan em uma coluna por um valor
df[‘A’] = df[‘A’].fillna(‘0,0’)
aplicar uma funcao em uma serie
df[‘A’] = df[‘A’].apply(function)
change a DataFrame column from string to date
import datetime
df[‘A’] = pd.to_datetime(df[‘A’], format=’%d/%m/%y’)
truncate (cut) values on a column
df[‘A’] = df[‘A’].map(str).str.slice(0,10)
consolida dataframes em um dataframe final
df_final.append(df_bradesco)
df_final = pd.concat(df_final, axis=0)
transforma uma coluna para o tipo string
df[‘A’].astype(str)
remover duplicatas de um dataframe
df.drop_duplicates(inplace=True)
left join de dois dataframes
df_final = pd.merge(df_final,df_teste,how=’left’,left_on=’KEY’,right_on=’KEY’)
para cada linha da serie, recebe um valor de outra serie
df.at[chave_base, ‘A’] = df_teste.at[chave_teste, ‘A’]
Saving DataFrames to an Excel Workbook
from pandas import ExcelWriter
writer = ExcelWriter(‘filename.xlsx’)
df1. to_excel(writer, ‘Sheet1’)
writer. save()
Save DataFrame as a dictionary
d = df.to_dict()
Save DataFrame as a string
str = df.to_string()
Save DataFrame as a numpy matrix
m = df.to_matrix()
Transpose rows and columns in a DataFrame
df = df.T
Iterate between columns
df.iteritems()
Iterate between rows
df.iterrows()