Python Pandas Flashcards
df.loc[’ ‘]
Leidzia is lenteles pasirinkti tam tikra eilute stulpeli .Galima pakonkretinti
df.loc[’ ‘].loc[][]
df.xs()
Kaip ir df.loc tik lengviau istraukti duomenis is lenteles vidaus
Galima pakonkretinti df.xs(1,level=’Num’)
df.dropna()
Istrins visus null reiksmes ,bet galima pakonkretinti
df.dropna(thresh=2) dabar istrins tik tuos kurie turi 2 arba daugiau null
df.fillna
Uzpildis nulines reiksmes
Galima pakonkretinti
df.fillna(value=’Fill Value’)
arba net uzpildyti pasirinkta nuline reiksme vidurkiu
df[‘A’].fillna(value=df[‘A’].mean())
KintPav=df.groupby(‘stulpav’)
Leidzia grupuoti duomenis
sudeti pvz Kompanijos sales
Galima naudoti
byComp.mean()
byComp.sum()
byComp.std()
Pakonkretinti
byComp.sum().loc[‘FB’]
Arba aplamai kad parodytu apibendrinta lentele (vidurkis,kvartiles…)
df.groupby(‘Company’).describe()
pd.concat([df1,df2,df3])
Sulipdo dataframe
Galima pakonkretinti
pd.concat([df1,df2,df3],axis=1)
pd.merge(left,right,how=’inner’,on=’key’)
Sujungia datagrame per kazkuria reiksme kuria nurodome per on=’ ‘
Galima sujungti per kelias reiksmes
pd.merge(left,right,on=[‘key1’,’key2’])
dfpavadinimas.join(kitoDfPav)
Sujungia df per atitinkamas eiluciu reiksmes
df[‘col2’].unique()
Isveda visas reiksmes nekartojant ju
Taip pat norint suzinoti kiek ju yra galima naudoti
df[‘col2’].nunique()
df[df[‘col1’]>2]
df[(df[‘col1’]>2)&(df[‘col2’]==444)]
Isfiltruoja pagal salyga
def times2(x):
return x*2
Funkcijos pavyzdys
df[‘col1’].apply(times2)
df[‘col2’].apply(lambda x:x*2)
Naudojant .apply galima panaudoti sukurta,lambda arba esama funkcija dataframe
df.columns
Isveda dataframe stulpeliu pavadinimus
df.sort_values(‘col2’)
Leidzia ruziuoti pagal pasirinkta stulpeli
df.isnull()
Parodo ar dataframe yra nuliniu reiksmiu