Numpy, pandas, visualiseringar & matplotlib Flashcards
Hur installerar man numpy, pandas och matplotlib?
Pip install numpy (pandas, och matplotlib). Om ni har anaconda, bör numpy, pandas och
matplotlib finnas på era datorer.
Vad är Numpy och Pandas?
Numpy är ett bibliotek för att hantera och utföra matematiska operationer på stora mängder data. Pandas är ett bibliotek som används för att hantera och analysera tabeller och tidsserier.
Vilka datatyper introducerar Numpy och Pandas?
Numpy introducerar array, som kan vara flerdimensionell. Pandas introducerar DataFrame, som är en tvådimensionell tabell med rader och kolumner.
Vad är en Numpy array?
En Numpy array är en flerdimensionell datatyp som kan innehålla numeriska data. Den är mycket mer flexibel än vanliga Python-listor.
Hur skapar du en Numpy array?
Du kan skapa en Numpy array med np.array(). Exempel:
first_array = np.array([0, 2, 4])
Hur ser en tvådimensionell Numpy array ut?
En tvådimensionell Numpy array ser ut som en matris eller tabell. Exempel:
second_array = np.array([[0, 2, 4], [5, 3, 1]])
Hur fungerar indexering i Numpy?
Du kan plocka ut data från en Numpy array genom att använda index. Exempel:
my_array[1:3] # Ger elementen på position 1 och 2
Vad gör np.shape?
np.shape ger storleken på en Numpy array i form av dess dimensioner. Exempel:
np.shape(second_array) # Output: (2, 3)
Hur gör du matematiska operationer på en Numpy array?
Du kan utföra operationer direkt på hela arrayen, t.ex. addera ett värde till varje element:
my_array + 3 # Adderar 3 till varje element i arraye
Hur skapar du en array fylld med nollor?
Du kan använda np.zeros() för att skapa en array fylld med nollor. Exempel:
zeros_2d = np.zeros([3, 6])
Vad gör np.mean och np.sum?
np.mean beräknar medelvärdet av en array, och np.sum beräknar summan av alla element. Exempel:
np.mean(my_array)
np.sum(my_array)
Hur beräknar du medelvärdet av en Numpy array längs en viss axis?
Du kan använda np.mean() med argumentet axis för att beräkna medelvärdet längs en specifik dimension. Exempel:
my_2d_array = np.array([[20, 30, 40], [10, 10, 20]])
np.mean(my_2d_array, axis=0)
# Beräknar medelvärdet längs raderna (kolumnvis)
# Output: array([15., 20., 30.])
np.mean(my_2d_array, axis=1)
Beräknar medelvärdet längs kolumnerna (radvis)
# Output: array([30., 13.33333333])
Hur beräknar du summan av en Numpy array längs en viss axis?
Du kan använda np.sum() med argumentet axis för att summera värden längs en specifik dimension. Exempel:
my_2d_array = np.array([[20, 30, 40], [10, 10, 20]])
np.sum(my_2d_array, axis=0)
Summerar längs raderna (kolumnvis)
# Output: array([30, 40, 60])
np.sum(my_2d_array, axis=1)
# Summerar längs kolumnerna (radvis)
# Output: array([90, 40])
Vad gör np.arange i Numpy?
np.arange() skapar en array av siffror från ett startvärde till ett slutvärde med ett visst intervall. Exempel:
np.arange(0, 10)
# Skapar array från 0 till 9
# Output: array
([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
np.arange(-1, 1.01, 0.25)
# Skapar array från -1 till 1 med steg om 0.25
# Output: array
([-1. , -0.75, -0.5 , -0.25, 0. , 0.25, 0.5 , 0.75, 1. ])
Hur hittar du det minsta och största värdet i en Numpy array?
Du kan använda np.min() och np.max() för att hitta det minsta respektive största värdet i en array. Exempel:
my_2d_array = np.array([[0, 1, 2, 3, 4], [10, 11, 12, 13, 10], [30, 43, 11, 50, 30]])
min_val = np.min(my_2d_array)
max_val = np.max(my_2d_array)
# Output: Min: 0, Max: 50
Hur hittar du index för det största och minsta värdet i en Numpy array?
Output: Min index: 0, Max index: 13
np.argmax() och np.argmin() ger indexet för det största respektive minsta värdet i arrayen. Exempel:
argmin_val = np.argmin(my_2d_array)
argmax_val = np.argmax(my_2d_array)
Varför Numpy?
Numpy är så grundläggande för så mycket inom dataanalys, AI och maskininlärning inom python.
Många packages är beroende av det och har numpy (t.ex. använder sig av numpy arrays).
Grundläggande förståelse av numpy hjälper att förstå andra verktyg (som pandas).
Sammanfattning Numpy
Numpy - sammanfattning
10 funktioner:
np.array, np.shape, np.arange, np.zeros, np.mean, np.sum, np.min, np.max,
np.argmin, np.argmax
Många matematiska operationer och indicering möjligheter med numpy.
Argument: axis.
Viktig argument för många numpy funktioner
Vad är en Pandas DataFrame?
En Pandas DataFrame är en tvådimensionell tabell som innehåller data organiserad i rader och kolumner. Den kan innehålla olika typer av data, såsom siffror och strängar.
Hur skapar du en Pandas DataFrame?
Du skapar en DataFrame genom att använda pd.DataFrame() och skicka in en ordlista där nycklarna är kolumnnamn och värdena är listor med data. Exempel:
df = pd.DataFrame(data={
‘name’: [‘Ashley’, ‘Blake’, ‘Casey’, ‘Dylon’],
‘study_hours’: [30, 35, 40, 10],
‘points_exam’: [20, 15, 22, 14],
‘grade’: [‘VG’, ‘G’, ‘VG’, ‘G’]
})