Numpy, pandas, visualiseringar & matplotlib Flashcards

1
Q

Hur installerar man numpy, pandas och matplotlib?

A

Pip install numpy (pandas, och matplotlib). Om ni har anaconda, bör numpy, pandas och
matplotlib finnas på era datorer.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vad är Numpy och Pandas?

A

Numpy är ett bibliotek för att hantera och utföra matematiska operationer på stora mängder data. Pandas är ett bibliotek som används för att hantera och analysera tabeller och tidsserier.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Vilka datatyper introducerar Numpy och Pandas?

A

Numpy introducerar array, som kan vara flerdimensionell. Pandas introducerar DataFrame, som är en tvådimensionell tabell med rader och kolumner.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vad är en Numpy array?

A

En Numpy array är en flerdimensionell datatyp som kan innehålla numeriska data. Den är mycket mer flexibel än vanliga Python-listor.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hur skapar du en Numpy array?

A

Du kan skapa en Numpy array med np.array(). Exempel:

first_array = np.array([0, 2, 4])

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hur ser en tvådimensionell Numpy array ut?

A

En tvådimensionell Numpy array ser ut som en matris eller tabell. Exempel:

second_array = np.array([[0, 2, 4], [5, 3, 1]])

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hur fungerar indexering i Numpy?

A

Du kan plocka ut data från en Numpy array genom att använda index. Exempel:

my_array[1:3] # Ger elementen på position 1 och 2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Vad gör np.shape?

A

np.shape ger storleken på en Numpy array i form av dess dimensioner. Exempel:

np.shape(second_array) # Output: (2, 3)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hur gör du matematiska operationer på en Numpy array?

A

Du kan utföra operationer direkt på hela arrayen, t.ex. addera ett värde till varje element:

my_array + 3 # Adderar 3 till varje element i arraye

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hur skapar du en array fylld med nollor?

A

Du kan använda np.zeros() för att skapa en array fylld med nollor. Exempel:

zeros_2d = np.zeros([3, 6])

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Vad gör np.mean och np.sum?

A

np.mean beräknar medelvärdet av en array, och np.sum beräknar summan av alla element. Exempel:

np.mean(my_array)
np.sum(my_array)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hur beräknar du medelvärdet av en Numpy array längs en viss axis?

A

Du kan använda np.mean() med argumentet axis för att beräkna medelvärdet längs en specifik dimension. Exempel:
my_2d_array = np.array([[20, 30, 40], [10, 10, 20]])
np.mean(my_2d_array, axis=0)

# Beräknar medelvärdet längs raderna (kolumnvis)
# Output: array([15., 20., 30.])

np.mean(my_2d_array, axis=1)

Beräknar medelvärdet längs kolumnerna (radvis)
# Output: array([30., 13.33333333])

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hur beräknar du summan av en Numpy array längs en viss axis?

A

Du kan använda np.sum() med argumentet axis för att summera värden längs en specifik dimension. Exempel:

my_2d_array = np.array([[20, 30, 40], [10, 10, 20]])
np.sum(my_2d_array, axis=0)

Summerar längs raderna (kolumnvis)
# Output: array([30, 40, 60])

np.sum(my_2d_array, axis=1)
# Summerar längs kolumnerna (radvis)
# Output: array([90, 40])

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Vad gör np.arange i Numpy?

A

np.arange() skapar en array av siffror från ett startvärde till ett slutvärde med ett visst intervall. Exempel:

np.arange(0, 10)
# Skapar array från 0 till 9
# Output: array
([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
np.arange(-1, 1.01, 0.25)
# Skapar array från -1 till 1 med steg om 0.25
# Output: array
([-1. , -0.75, -0.5 , -0.25, 0. , 0.25, 0.5 , 0.75, 1. ])

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hur hittar du det minsta och största värdet i en Numpy array?

A

Du kan använda np.min() och np.max() för att hitta det minsta respektive största värdet i en array. Exempel:

my_2d_array = np.array([[0, 1, 2, 3, 4], [10, 11, 12, 13, 10], [30, 43, 11, 50, 30]])
min_val = np.min(my_2d_array)
max_val = np.max(my_2d_array)
# Output: Min: 0, Max: 50

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hur hittar du index för det största och minsta värdet i en Numpy array?

A

Output: Min index: 0, Max index: 13

np.argmax() och np.argmin() ger indexet för det största respektive minsta värdet i arrayen. Exempel:

argmin_val = np.argmin(my_2d_array)
argmax_val = np.argmax(my_2d_array)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Varför Numpy?

A

Numpy är så grundläggande för så mycket inom dataanalys, AI och maskininlärning inom python.
Många packages är beroende av det och har numpy (t.ex. använder sig av numpy arrays).
Grundläggande förståelse av numpy hjälper att förstå andra verktyg (som pandas).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Sammanfattning Numpy

A

Numpy - sammanfattning
10 funktioner:
np.array, np.shape, np.arange, np.zeros, np.mean, np.sum, np.min, np.max,
np.argmin, np.argmax
Många matematiska operationer och indicering möjligheter med numpy.
Argument: axis.
Viktig argument för många numpy funktioner

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Vad är en Pandas DataFrame?

A

En Pandas DataFrame är en tvådimensionell tabell som innehåller data organiserad i rader och kolumner. Den kan innehålla olika typer av data, såsom siffror och strängar.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Hur skapar du en Pandas DataFrame?

A

Du skapar en DataFrame genom att använda pd.DataFrame() och skicka in en ordlista där nycklarna är kolumnnamn och värdena är listor med data. Exempel:

df = pd.DataFrame(data={
‘name’: [‘Ashley’, ‘Blake’, ‘Casey’, ‘Dylon’],
‘study_hours’: [30, 35, 40, 10],
‘points_exam’: [20, 15, 22, 14],
‘grade’: [‘VG’, ‘G’, ‘VG’, ‘G’]
})

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Vilka komponenter består en DataFrame av?

A

En DataFrame består av:
Kolumner (df.columns): Namnen på kolumnerna.

Rader (df.index): Numrerade eller etiketterade rader.

Värden (df.values): Själva datan i tabellen.

21
Q

Hur visar du kolumnerna i en DataFrame?

A

Output: Index([‘name’, ‘study_hours’, ‘points_exam’, ‘grade’], dtype =’object’)

Använd df.columns för att visa kolumnnamnen i DataFrame. Exempel:

print(df.columns)
# Output: Index([‘name’, ‘study_hours’, ‘points_exam’, ‘grade’], dtype=’object’)

22
Q

Hur visar du raderna i en DataFrame?

A

Output: RangeIndex(start=0, stop=4, step=1)

Använd df.index för att visa indexen för raderna i DataFrame. Exempel:

print(df.index)
# Output: RangeIndex(start=0, stop=4, step=1)

23
Q

Hur visar du alla värden i en DataFrame?

A

Använd df.values för att visa alla värden i DataFrame som en Numpy array. Exempel:
print(df.values)
# Output:
# array([[‘Ashley’, 30, 20, ‘VG’],
# [‘Blake’, 35, 15, ‘G’],
# [‘Casey’, 40, 22, ‘VG’],
# [‘Dylon’, 10, 14, ‘G’]], dtype=object)

24
Q

Hur får du tillgång till data i en specifik kolumn i en DataFrame?

A

Använd df[‘column_name’] för att få tillgång till data i en specifik kolumn. Exempel:

print(df[‘name’])
# Output:
# 0 Ashley
# 1 Blake
# 2 Casey
# 3 Dylon
# Name: name, dtype: object

25
Q

Hur får du tillgång till data i en specifik rad i en DataFrame?

A

Använd df.iloc[index] för att få tillgång till en rad baserat på dess index. Exempel:

python
Copy code
print(df.iloc[1])
# Output:
# name Blake
# study_hours 35
# points_exam 15
# grade G
# Name: 1, dtype: object

26
Q

Hur läser du in en CSV-fil till en DataFrame?

A

Använd pd.read_csv(‘filnamn.csv’) för att läsa in en CSV-fil och skapa en DataFrame från den. Exempel:

df_csv = pd.read_csv(‘file.csv’)

27
Q

Hur läser du in en Excel-fil till en DataFrame?

A

Använd pd.read_excel(‘filnamn.xlsx’) för att läsa in en Excel-fil och skapa en DataFrame från den. Exempel:

df_excel = pd.read_excel(‘file.xlsx’)

28
Q

Vad är en csv fil?

A

En text fil där varje rad är en ny rad och varje column sepereras med ett kommatecken (comma seperated values).
col1, col2, col3
1, 2, 3
5, 6, 7

29
Q

Hur kan du använda Numpy-metoder på en DataFrame?

A

Du kan använda Numpy-metoder som mean() och sum() på en DataFrame för att få statistiska värden. Exempel:

print(df.mean())
# Output:
# study_hours 28.75
# points_exam 17.75
# dtype: float64

30
Q

Hur visar du de första raderna i en DataFrame?

A

Output:

Använd df.head(n) för att visa de första n raderna i DataFrame. Exempel:

print(df.head(3))
# name study_hours points_exam grade
# 0 Ashley 30 20 VG
# 1 Blake 35 15 G
# 2 Casey 40 22 VG

31
Q

Hur får du beskrivande statistik om en DataFrame?

A

Använd df.describe() för att få en översikt över beskrivande statistik för DataFrame, såsom medelvärden och standardavvikelser. Exempel:

print(df.describe())
# Output:
# study_hours points_exam
# count 4.000000 4.00000
# mean 28.750000 17.75000
# std 13.149778 3.86221
# min 10.000000 14.00000
# 25% 25.000000 14.75000
# 50% 32.500000 17.50000
# 75% 36.250000 20.50000
# max 40.000000 22.00000

32
Q

Hur grupperar du data i en DataFrame?

A

Använd df.groupby(‘column’) för att gruppera data baserat på en kolumn och sedan utföra beräkningar på varje grupp. Exempel:

grouped_df = df.groupby(‘grade’).mean()
print(grouped_df)
# Output:
# study_hours points_exam
# grade
# G 22.5 14.5
# VG 35.0 21.0

33
Q

Hur sparar du en DataFrame till en CSV- eller Excel-fil?

A

Använd df.to_csv(‘output.csv’) eller df.to_excel(‘output.xlsx’) för att spara DataFrame till en fil. Exempel:

df.to_csv(‘output.csv’)
df.to_excel(‘output.xlsx’)

34
Q

Vilka är några viktiga Pandas-funktioner att känna till?

A

pd.DataFrame(): Skapa en DataFrame.
df.columns, df.index, df.values: Visa DataFrames komponenter.
df[‘column’], df.iloc[index]: Få tillgång till kolumn- och raddata.
pd.read_csv(), df.to_csv(), df.to_excel(): Läsa in och spara data.
df.describe(), df.head(), df.groupby(): Få statistisk information och gruppera data.

35
Q

Varför är visualiseringar viktiga?

A

Visualiseringar är ett effektivt sätt att kommunicera komplex information, upptäcka nya insikter, och har blivit populärt inom journalistik. De är ofta det första vi tittar på när vi analyserar data.

36
Q

Varför är visualiseringar viktiga i en programmeringskurs?

A

Att visualisera komplexa data är relativt enkelt med många programmeringsspråk, och det gäller både statiska och interaktiva figurer.

37
Q

Vilka typer av visualiseringar är vanliga?

A

Vanliga visualiseringar inkluderar histogram, linjediagram, scatterplots, stapeldiagram och boxplots. Varje typ är lämplig för att visa olika typer av data och mönster. Olika typer av visualiseringar kan vara mer lämplig i olika situationer. Visa informationen om eller relationen variabler. Målet är att kommunicera

38
Q

Vad visar ett histogram?

A

Ett histogram visar frekvensen av data inom olika intervall. X-axeln representerar intervallen, och Y-axeln visar frekvensen.

39
Q

Vad används ett linjediagram (line plot) till?

A

Linjediagram används för att visualisera trender och mönster över tid eller kontinuerliga värden.

40
Q

Vad visar ett scatterplot?

A

Ett scatterplot visar sambandet mellan två variabler och används för att identifiera korrelationer eller mönster. Varje punkt representerar ett par av värden.

41
Q

Vad visar ett stapeldiagram (bar plot)?

A

Ett stapeldiagram visar antal eller frekvens för olika kategorier. Det används för att jämföra värden över olika grupper eller kategorier.

42
Q

Vad visar ett boxplot?

A

Ett boxplot visar fördelningen av data, inklusive median, kvartiler (IQR), och eventuella outliers. Det ger en visuell sammanfattning av flera variablers statistik.

43
Q

Vad är “chartjunk”?

A

: Chartjunk är onödiga eller vilseledande grafiska element i en visualisering, som t.ex. 3D-effekter, som gör det svårare att förstå datan.

44
Q

Vilka är de viktigaste aspekterna att tänka på i en visualisering?

A

Tydliga axellabels för att förklara variablerna.
Lättförståeliga skalor och enheter.
Undvik chartjunk.
Använd färger för att förstärka budskapet.

45
Q

Vad är Matplotlib?

A

Matplotlib är ett standard Python-paket för att skapa visualiseringar. Det används för att skapa figurer som linjediagram, scatterplots, stapeldiagram, histogram, och boxplots.

46
Q

Importera matplotlib?

A

import matplotlib.pyplot as plt

import numpy as np
import pandas as pd

47
Q

Hur skapar du en figur med Matplotlib?

A

Du kan skapa en figur med plt.figure() och lägga till en axel med fig.add_subplot(). Alternativt kan du använda plt.subplots() för att skapa en figur med en eller flera axlar. Exempel:

fig = plt.figure()
ax = fig.add_subplot()
eller

fig, ax = plt.subplots()

47
Q

Det finns några olika sätt att skapa figurer. Vilka två sätt?

A

fig
Figuren i allmänt.
ax
Axis. Innehållet.
Det är möjligt att ha flera ax (flera subfigurer) i en fig
object

48
Q

Hur skapar du en figur med flera axlar i Matplotlib?

A

Använd plt.subplots(rows, cols) för att skapa en figur med flera axlar. Varje axel kan nås genom att använda index. Exempel:

fig, ax = plt.subplots(2, 3)
# Skapar en figur med 2 rader och 3 kolumner av axlar
ax[0, 0] # Refererar till den första axeln

49
Q
A