Pandas Flashcards

Question 1

Q

To merge csv tables from scrape in Pandas

Answer

A

DataframeName = pd.concat([df, df2, df3], axis=1, sort=False)

Question 2

Q

To find if there are duplicate rows

Answer

A

df.column name.duplicated()

Question 3

Q

Displays the duplicate rows

Answer

A

df.loc[df.duplicated(), :]

Question 4

Q

To mark duplicates except for the first occurrence

Answer

A

df.loc[df.duplicated(keep = ‘first’), :]

Question 5

Q

To mark duplicates except for the last occurrence

Answer

A

df.loc[df.duplicated(keep = ‘last’), :]

Question 6

Q

To mark all duplicates as True (all will be displayed)

Answer

A

df.loc[df.duplicated(keep = False), :]

Question 7

Q

To drop duplicates from the data frame

Answer

A

df.drop_duplicates(keep=’first’).shape

Question 8

Q

Save file in Numpy

Load file in Numpy

Answer

A

Arr = np.arrange(10)

np. save(‘file_name’, arr)
np. load(‘file_name.npy’)

Question 9

Q

Drop row(s)

Answer

A

DataframeName.drop([‘row name’, ‘row name’])

Question 10

Q

Transpose Datafram (swap rows and columns)

Answer

A

DataframeName.T

Question 11

Q

Add 2 dfs, and keep values where rows and columns dont match.

Answer

A

df1.add(df2, fill_value = 0)

Question 12

Q

Creating DF with 12 count, 4 rows, 3 columns, A, B,C as column nanes, and 4 states as index.

Answer

A

df = pd.Dataframe(np.arrange(12.).reshape ((4,3), columns = list (‘ABC’), index = [‘New York’, ‘Florida’, ‘California’, ‘Nevada’])

Question 13

Q

Create own dataframe

Answer

A

df = pd.dataframe({‘A’ : [0, 1, 2, 3, 4], ‘B’: [5, 6, 7, 8], ‘C’: [9, 10, 11, 12]})

Question 14

Q

Load csv into Pandas and create header row

Answer

A

“pd.read_csv(‘examples/ex2.csv’, names=[‘a’, ‘b’, ‘c’, ‘d’, ‘message’])”

Question 15

Q

To check for duplicate rows

Answer

A

data.duplicated()

Question 16

Q

To drop duplicates

Answer

Study These Flashcards

A

data.drop_duplicates()

Question 17

Q

Add mean/average column for averages

Answer

Study These Flashcards

A

DataframeName[‘Mean’] = DataframeName.mean(numeric_only=True, axis =1)

Question 18

Q

Surpressing scientific notation

Answer

Study These Flashcards

A

pd.set_option(‘display.float_format’, ‘‘.format)

Question 19

Q

Supress scientific notation and format with dollar sign and commas

Answer

Study These Flashcards

A

pd.set_option(‘display.float_format’, ‘${:,.2f}’.format)

Question 20

Q

To view rows or select specific row and all columns

Answer

Study These Flashcards

A

DataFrameName.loc[‘Row_Name’, :]
loc.[what rows do i want, what column do I want]
: = all columns

Question 21

Q

To view multiple rows

Answer

Study These Flashcards

A

DataFrameName.loc[[‘Row_Name’, ‘Row_Name’, ‘Row_Name’ :]]

Question 22

Q

To select a column and all rows

Answer

Study These Flashcards

A

df9.loc[:, ‘column_name’ ]

Question 23

Q

To select multiple columns and all rows

Answer

Study These Flashcards

A

df9.loc[:, [‘column_name.’, ‘column_name’]]

Question 24

Q

To arrange list into array

Answer

Study These Flashcards

A

ListName.reshape((#of rows, # of columns))

Pandas Flashcards

(24 cards)