pandas lesson 3 Flashcards

Question 1

Q

How do I show only the first 10 rows (use slicing).

Answer

A

data[‘duration’][:10]

Question 2

Q

How do I check if column has NaN values? Do this for the column country in the data df.

Answer

A

data.country.isna()

Question 3

Q

Replace any NaN values inthe country column in the data df.

Answer

A

data.country.fillna(‘’)

Question 4

Q

Replace any NaN values in the column duration with the mean value.

Answer

A

data.duration = data.duration.fillna(data.duration.mean())

Question 5

Q

Get rid of any rows that have a missing value.

Answer

A

data.dropna()

Question 6

Q

Drop rows that have all na values

Answer

A

data.dropna(how=’all’)

Question 7

Q

Drop rows where there are 5 na values.

Answer

A

data.dropna(thresh=5)

Question 8

Q

Drop rows within a column that has na values in it. Do this for the column ‘title_year’.

Answer

A

data.dropna(subset=[‘title_year’])

Question 9

Q

Show columns that contain any na values. Filter out, don’t drop.

Answer

A

data[data.isna().any(axis=1)]

Question 10

Q

Drop columns that are all na values.

Answer

A

data.dropna(axis=1, how=’all’)

Question 11

Q

Drop columns that have any na values.

Answer

A

data.dropna(axis=1, how=’any’)

Question 12

Q

Save the results to a csv file

Answer

A

data.to_csv(r’C:\Users\User\Documents\CFG_DATA\Data_files\movie_metadata.csv’)

Question 13

Q

Read the csv file and ensure that duration is an integer.

Answer

A

data = pd.read_csv(r’C:\Users\User\Documents\CFG_DATA\Data_files\movie_metadata.csv’, dtype={‘duration’: int})

Question 14

Q

Read the csv file and ensure that actor_2_facebook_likes is a string.

Answer

A

data = pd.read_csv(r’C:\Users\User\Documents\CFG_DATA\Data_files\movie_metadata.csv’, dtype={‘actor_2_facebook_likes’: str})

Question 15

Q

Change all characters in column movie_title to capital letters.

Answer

A

data[‘movie_title’].str.upper()

Question 16

Q

Remove any trailing whitespace from movie_title

Answer

Study These Flashcards

A

data[‘movie_title’].str.strip()

Question 17

Q

Rename columns title_year to release_date and movie_facebook_likes to facebook_likes

Answer

Study These Flashcards

A

data.rename(columns = {‘title_year’:’release_date’, ‘movie_facebook_likes’:’facebook_likes’})

Question 18

Q

Export your df back to a csv file.

Answer

Study These Flashcards

A

data.to_csv(r’C:\Users\User\Documents\CFG_DATA\Data_files\cleanfile.csv’, encoding=’utf-8’)

pandas lesson 3 Flashcards

(18 cards)