TIG 122 - Maskininlärning och dataanalys Flashcards

Question 1

Q

Deep Learning

Answer

A

Ai modeller bestående av flera lager
Efterliknar den mänskliga hjärnans funktion
För att kunna analysera mer komplexitet

Question 2

Q

SLP - Singel layer perceptron

Answer

A

Ett input lager och en output neuron
Hanterar linjära problem- t.ex klassificerings uppgifter

Question 3

Q

MLP - Multi - layer perceptron

Answer

A

Minst 3 lager - in-put, hidden och out-put
Använder backpropagation

Question 4

Q

DNN - Deep neural network

Answer

A

Flera hidden layers
Hanterar komplexa problem med en stor mängd data
Varje lager har en egen funktion

Question 5

Q

Forward propagation

Answer

A

Datan rör sig framåt genom närverket, lager för lager

Question 6

Q

Loss function

Answer

A

Skillanden mellan den beräknade out-put och den faktiska
Används för att mäta nätverkets prestanda/ tränings framgång

Question 7

Q

Backpropagation

Answer

A

Nätverket kalkylerar skillnaden mellan outputen och den förväntade outputen - loss function
Nätverket arbetar sig bakåt och justerar vikterna längs vägen utifrån loss function
Upprepas till outputen nått målet

Question 8

Q

CNN - Convolutional neural network

Answer

A

Analyserar visuell data (bilder och videor)
Applicerar filter som tar sig genom bilden för att identifiera mönster
Bildigenkänning, ansiktsigenkänning, medicinsk bildanalys, självkörande fordon

Question 9

Q

XAI methods

Answer

A

Metoder som gör det möjligt att förstå och förklara hur ai-modeller fattar sina beslut
Framförallt viktig i när ai t.ex används inom vården

Question 10

Q

Nämn 3 olika XAI metoder

Answer

A

Post - hoc metod - försöker förklara modellens beslut i efterhand baserat på t.ex spelteorin
Intrinnsiska metoder - Modellen har en inbyggd form av förklaring system som själv tolkar och återberättar funktioner och resultat
Visualiseringsmetoder - använder visuella representationer för att tolka och förstå

Question 11

Q

Object detectors

Answer

A

Finns i CNN modeller
Lokaliserar och klassificerar objekt i bilder och videos

Question 12

Q

Transformers

Answer

A

NPL - nartulig språkbehandling
-bearbetar data parallellt
använder attention

Question 13

Q

Symbolisk/Klassisk AI

Answer

A

Använder symboler för representation av information
Utför logiska operationer
Top- down system
Människan definierar regler och matar in data
får ut ett svar

Question 14

Q

ANN - Articiella neurala nätverk

Answer

A

Inspirerad av hjärnans funktioner ¨
Bearbetar datan genom aktiveringsfuntkioner
Kan lära sig från data och hitta mönster i data
Modellen listar själv ut reglerna - matar in svar och data

Question 15

Q

MINIST

Answer

A

Databas - består av handskrivna siffror mellan (0-9)
Används för att träna och testa modeller
60 000 tränings bilder och 10 000 testbilder

Question 16

Q

Träningsalgoritmer

Answer

A

Om output är korrekt ändra ingenting
Om output är 1 men skulle vara 0 - sänk vikten
Om output är 0 men skulle vara 1 - hög vikten

Question 17

Q

Vilka är de mest populära ramverken för att bygga och träna neurala nätverk?

Answer

A

PYT ROC - Meta
TensorFlow - Google

Question 18

Q

Google Colab

Answer

A

Kodmiljö, använder Jupiter nootbook
Använder GPU och TPU

Question 19

Q

GPU - graphics processing unit

Answer

A

Används för att utföra beräkningar inom maskininlärning och deep learning
Optimerad för parallella beräkningar

Question 20

Q

TPU - Tensor processing unit

Answer

A

Specialbyggd för AI i Tensor Flow
Hanterar tensor-beräkningar (matriser)

Question 21

Q

Keras

Answer

A

Ett gränssnitt som gör det möjligt för flera olika delar av en modell att kommunicera med varandra
Definieras vad som kan göras men inte hur de kan göras
Besitter t.ex funktioner för hur en modell ska tränas

Question 22

Q

Sequential

Answer

A

En struktur för att bygga neurala närverk
Där ett lager är kopplat till nästa osv
Enkelt och linjärt

Question 23

Q

Vektor

Answer

A

Matriser som används för att lagra numerisk data
Används ofta för att t.ex beskriva egenskaper hos ett objekt

Question 24

Q

Array

Answer

A

Funktionen hos numpy
Data struktur som lagrar en samling av element
Alla element i en array har samma datatyp
Kan bestå av flera dimensioner

Question 25

Q

Tensor

Answer

A

En matematisk struktur
Lagrar vikter och bias i neurala nätverk
Representerar och bearbetar data

Question 26

Q

Tensors uppbyggnad

Answer

A

0D tensor: Ett enda tal (skalar).
1D tensor: En vektor (en lista av tal).
2D tensor: En matris (en tabell med rader och kolumner).
3D tensor: En “matris av matriser” (t.ex. en kub av data).

Question 27

Q

NumPy 2D-tensor

Answer

A

Vanligt inom maskininlärning
Representerar input datan och vikterna i modellen
Enkel representation av data

Question 28

Q

Vektorrymd

Answer

A

Ett utrymme där vektorer kan placeras
Används för att beräkna avstånd och likheter mellan data punkter

Question 29

Q

NumPy shape

Answer

A

Ger information om hur många rader, kolumner och dimensioner en array har
Ger information om hur många element en array har

Question 30

Q

Preprocessing av data

Answer

A

Om datan behöver processas innan den används i nätverket för att omvandla till ett mer effektivt format

Question 31

Q

Normalisering av data

Answer

A

Justerar värden i datasetet så det ligger inom ett viss intervall
Kan på så sätt behandlas mer effektivt i modellen

Question 32

Q

Aktiveringsfunktion

Answer

A

En funktion som avgör värdet på datan för att få skicka vidare information eller inte

Question 33

Q

Softmax

Answer

A

Aktiveringsfunktion
Framställer ett sannolikhetsvärde för varje möjlig output och den med störst sannolikhet blir sedan den slutgiltiga outputen

Question 34

Q

ReLU

Answer

A

Aktiveringsfunktion ¨
Används ofta i dolda lager
Introducerar icke-linjäritet
Omvandlar alla negativa värden till 0 och låter alla positiva vara oförändrade
Lär sig komplexa mönster i datan

Question 35

Q

Vad gör man när man kompilerar ett nätverk?

Answer

A

Färdigställer det för träning
Specificerar viktiga inställningar - 3 parametrar

Question 36

Q

Vilka är de parametrar som specificeras under kompilering?

Answer

A

Loss function - t.ex definierar om nätverkets sanna värden
Optimizer - Styr hur vikterna förändras under träning
Matrics - Undersöker hur bra modellen presenterar på träning

Question 37

Q

model.fit ()

Answer

A

Inbyggd funktion i keras som baserat på träningsdata justerar modellens vikter

Question 38

Q

Epochs

Answer

A

Epoker är gångerna man kör igenom träningsdata genom modellen

Question 39

Q

Validation_split

Answer

A

Gör att en viss andel av träningsdatan sparas undan för att istället kunna använda under validering
Modellen kan då testas på data den tidigare inte exponerats för vilket övervakar generaliseringsförmågan

Question 40

Q

Evolvuering av nätverk

Answer

A

Använder evolutions algoritmer för att att automatiskt skapa, justera och förbättra arkitekturen hos ANN
- Syftet är att hitta den bästa strukturen utifrån specifika problem
- t.ex hur många lager nätverket ska

Question 41

Q

Vektor - matematisk building

Answer

A

Representation av data i from av siffror för beräkningar

Question 42

Q

Dot product (skalär)

Answer

A

En viktad summa
Dimension 0
En matematisk operation mellan två vektorer.
Använda för att beräkna ett mått på likheten mellan två vektorer

Question 43

Q

Hur får man fram en dot procuct (skalär) av vektorer?

Answer

A

Två vektorer som är lika långa
multiplicerar koordinaten med respektive koordinat i den andra vektorn
Sedan adderar alla produkter med varandra
t.ex - w1x1 + w2x2

Question 44

Q

Matrices

Answer

A

2 dimentionell datastruktur
Rader presenterar någon from av egenskap
Kolumner presenterar en annan form av egenskap
Definierar all data ihop

Question 45

Q

Tensor (array)

Answer

A

Förvarar data
Organiserar olika typer av data i flera dimensioner

Question 46

Q

Data sets

Answer

A

En samling data av samma typ som man organiserar

Question 47

Q

image data set

Answer

A

En samling bilder som används för att träna maskininlärnings modeller för att utföra uppgifter som bildklassificering, objektigenkänning osv

Question 48

Q

Vilken aktiveringsfunktion är bra att ha kopplat med MNISt dataset?

Question 49

Q

Träningsprocessen hos ett ANN

Answer

A

Partial derivatas

Question 50

Q

Tangentlinje / tangent line

Answer

A

En linje som rör vid kurvan vid en viss punkt

Question 51

Q

Slope/lutning

Answer

A

Lutningen hos tangent line i de olika punkterna

Question 52

Q

Hur slope räknas ut

Answer

A

y = kx +m
k = lutningen
Väljer 2 punkter på linjen
dividerar skillnaden i x -led mot skillnaden i
y/x = k
Räknar ut linjens lutning men får då hur mycket kurvan lutar i just den punkten

Question 53

Q

Derivatan

Answer

A

Lutningen hos tangent linjen
c = f(c)
Talar om hur mycket det lutar i en punkt på kurvan

Question 54

Q

Träning loop av ett neuralt nätverk

Answer

A

väljer ut ett antal data punkter man ska träna sitt nätverk på (information från indata)
För varje input testar man då och får en output
Räknar sedan ut loss function för varje data punkt
Algoritmen gardient decent används sedan genom att räkna ut derivatan och avgör sedan hur vi ska förändra vikterna för att få ett mindre loss

Question 55

Q

Gradient descent

Answer

A

Optimerings algoritm som räknar ut derivatan (lutningen) av loss function med avseende av vikterna = gradienten (lutningen)
Gradienten talar om hur mycket loss function förändras om vikterna ändras
Gör ofta små förändringar i taget och uppdaterar vikterna i rätt riktning för att minska loss
Går igenom alla punkter i datan

Question 56

Q

Dataset

Answer

A

Samling av data som mats in i modellen

Question 57

Q

Trainingsdataset

Answer

A

Används för träning av modellen ‘
Justerar modellens interna parametrar genom att minimera loss function - 70%

Question 58

Q

Valideringsdataset

Answer

A

Används för att justera hyperparamtrar (inställningar som inte lärs av modellen) t.ex inlärningshastigheet, antal lager osv
Kontrollerar modellens prestanda och generaliserbarhet - 15%

Question 59

Q

Testdataset

Answer

A

Används efter träning för att utvärdera modellens generaliserbarhet på osedd data - 15%

Question 60

Q

Mean squared error

Answer

A

Mått som används för att uppskatta hur bra en modell presterar
mäter genomsnittet av loss function

Question 61

Q

Generaliserbarhet

Answer

A

Modellens förmåga att prestera bra på ny data den inte tidigare har expanderats för
Modellen lär sig hitta mönster i träningsdatan som den sedan kan applicera på ny data

Question 62

Q

Hur når man generaliserbarhet?

Answer

A

Använd lagom komplex data
Avsluta träningen när prestandan på valideringsdatan slutar förbättras
Öka variationen i träningsdatan

Question 63

Q

Optimering

Answer

A

Processen som sker när man minimerar loss founction
Handlar om att hitta en punkt där loss function är tillräckligt låg i träningsdatan

Question 64

Q

Vad händer om man tar optimeringen för långt?

Answer

A

Det kan leda till overfitting

Answer 64

A

Modellen har lärt sig träningsdatan för bra
Betyder att modellen inte har lärt sig hitta mönster hos träningsdatan utan istället lärt sig detaljer och saker som är unikt för träningsdatan (memorerar istället för att förstå “reglerna”)

Answer 65

A

Modellen kommer presetera bra på träningsdatan men kommer misslyckas med data som den tidiagre inte har exponerats för

Answer 66

A

Skapa variation i träningsdatan
Öka mängden träningsdata

Answer 67

A

Modellen är för enkel eller otränad för att identifiera underliggande mönster i datan
Presterar dåligt på både träninngsdata och osedd data

Answer 68

A

Modellen är för simpel, finns inte tillräckligt med parametrar som kan fånga komplexitet i datan
Träningen har avbrutits för tidigt

Answer 69

A

Bar generaliserbarhet
Påverkas inte av enstaka extremvärden

Answer 70

A

Slumpmässiga fel eller irrelevanta variationer i datan som inte återspeglar de mönster vi vill att modellen ska lära sig

Answer 71

A

Brus kan göra att modellen tvingas hitt mönster
Slumpmässiga förändringar i datan får modellen att fokusera på mönster och ej enstaka detaljer

Answer 72

A

Metod för maskininlärning
Skapar nya datapunkter mellan två eller flera redan existerande punkter
Med syfte att fylla i luckor eller skapa smidiga övergångar mellan redan kända punkter
Skapar mer träningsdata

Answer 73

A

Räknar ut loss function
metod för en mer pålitlig utvärdering av en modell

Answer 74

A

Viktigt att alla dataset speglar den verkliga datan som modellen kommer att stöta på i praktiken

Answer 75

A

Viktigt att alla dataset spegalr verkliga förhållanden, då förändringar sker

Answer 76

A

Undvika identiska datapunkter i treänings och test data då modellen kan ha memorerat

Answer 77

A

Optimeringsalgoritm
Fungerar på samma sätt som GD, men istället för att gå igenom alla punkter i datan uppdaterar den endast enskilda och slumpmässiga punkter.
Bra för att hantera stora dataset

Answer 78

A

Optimeringsalgoritm
Kommer ihåg tidigare gradienter
Använder medelvärden av gradienter baserat på historik
kräver ofta justering av hyperparametrar
Olika dtapunkter jämförs inte med varandra utan kan lära sig i sin takt

Answer 79

A

Hyperparemeter
Styr hur stora steg optimeraren ska ta i justering av modellens vikter under träning
Kan vara bra att göra små förändringar för att inte missa viktiga steg, men kan gå långsamt

Answer 80

A

Hur många exempel av träningsdatan modellen bearbetar innan vikterna uppdateras under träning

Answer 81

A

Tabell som används för att utvärdera prestandan hos en klassificeringsmodell
Jämför loss fuction och visar hur många exempel som är korrekta och hur många som blev fel

Answer 82

A

Perceptron
En rak linje kan separera data punkter

Answer 83

A

En rak linje kan inte separera datapunkterna korrekt
Behövs något mer komplext med fler lager och neuroner

Answer 84

A

Kan uppstå i träning av MLP
Svårigheter med att identifiera vilka vikter eller parametrar som är ansvariga för felaktiga resultat

Answer 85

A

Använder backpropagation

Answer 86

A

Hierarkiskt upplägg där mer komplex mönster uppfattas av senare lager
Olika neuroner är specialiserade på att känna igen olika typer av visuell information

Answer 87

A

En av de första CNN - 80-90 talet
Kombinationen av hierarkisk bearbetning och backpropagation
Fullt ansluta lager
5 lager

Answer 88

A

2012 det stora genombrottet för CNN
djupare nätverk = 8 lager

Answer 89

A

Bildigenkänning, bildklassificering och objektidentifiering

Answer 90

A

Varje neuron är kopplad till ett receptivt fält i nästa lager, dvs en lokal region av neuroner

Answer 91

A

Konvolutionslager / Convolutional layer
ReLU - lager
Pooling - lager
Fullt anslutet lager

Answer 92

A

Extraherar egenskaper i indatan genom filter och feautermaps

Answer 93

A

Introducerar icke-linjäritet i modellen
Vilket innebär att alla negativa värden sätts till 0

Answer 94

A

Minskar dimensionerna hos feature maps, behåller de framträdande egenskaperna, vilket gör modellen mindre känslig för små förändringar
t.ex filtreras brus bort

Answer 95

A

Alla neuroner mellan två nätverk är kopplade till varandra,
Kombinerar alla egenskaper/features och fattar ett slutgiltigt beslut som sedan skickas genom aktiveringesfunktionen

Answer 96

A

Sannolikhets funktion
Ger ett värde mellan 0-1 för aktivering av värdet
Klassificerar ett värde/ skalär i taget

Answer 97

A

Sannolikhets funktion¨
Ger ett värde mellan 0-1 för aktivering
Klassificerar en hel vektor samtidigt/ flera värden

Answer 98

A

Filtret flyttas steg för steg över input bilden
Varje element i bilden multipliceras med motsvarande pixelvärde
Summan blir sedan en siffra som placeras i lagrets feauture map

Answer 99

A

Representerar vad/hur mycket ett filter har hittat i form av egenskaper/ mönster i olika delar av bilden
indelad i delar av bilden vilket motsvarar neuroner

Answer 100

A

3x3 Feture map Uträkningen:
1 2 3 11 + 20 + 3* (-1) +
4 5 6 41 + 50 + 6* (-1) +
7 8 9 71 + 80 + 9 * (-1) = 1 = summan
i den första rutan i feature
mapen, sedan hoppar den så
många stride den har vilket
innebär steg filtret ska ta

Answer 101

A

Minskar dimensionerna hos fetaure map för att hjälpa modellen med spatial Invariance
Väljer det största värdet i varje del av pooling mapen

Answer 102

A

Gör att nätverket i träning inte fastnar i var något befinner sig i bilden, utan kan fånga en mer generaliserad bild och känna igen egenskaper oberoende av storlek, placering eller vridning i bilden

Answer 103

A

Visual cortex fungerar på samma sätt:
Olika delar processar olika saker i form av nivåer
t.ex v1 processar minsta egenskaperna i bilden
v2- processar färg osv

Answer 104

A

Ytlig modell
1 lager , lagret har 5 filter vilket innebär 5 feture maps

Answer 105

A

klassificering av objekt i bilder eller videos

Answer 106

A

Algoritmen skannar bilden och identifierar var objekten finns genom att placera bounding boxes runt varje upptäckt objekt

Answer 107

A

Koordinaterna i övre vänstra hörnet samt nedre högra hörnet

Answer 108

A

Efter lokalisering, tilldelar modellen varje bounding box en etikett, baserat på vad den tror finns i boxsen
vi sannolikhets funktion

Answer 109

A

Letar efter intressanta områden för att sedan i nästa steg klassificera de - tvåstegs modell
Regioner föreslås, varje region beräknas och skickas genom ett CNN för att undersöka egenskaper i regionen
Mycket noggrann men också mycket långsam

Answer 110

A

Identifierar både var och vad objektet är i bara ett steg
Kan fånga objekt i olika storlekar då den består av flera feature maps som kan fokusera på olika skalor av objekt
Använder default boxex, som alltså är förbestämda boxar som placeras ut över bilden
1. om det finns ett objekt i boxen klassificera
2. Behöver boxen justeras för att passa objektet

Answer 111

A

Localization loss - justerar boxarnas position
Confidence loss - Förbättring av klassificering av objekt

Answer 112

A

Bilden delas in i ett rutnät, där varje cell i rutnätet förutspår ett visst antal bounding boxes
Genererar alltså många överlappande boxar, som sedan används för att använda de mest sannolika
snabb, men tenderar att missa små objekt

Answer 113

A

Radar, kameror oh ljudsensorer för att “se” och känna igen omgivningen

Answer 114

A

Kontrollerar gas, broms och styrning baserat på beslutsfattande av datorn

Answer 115

A

Processorer som bearbetar data från sensorer genom algoritmer och fattar beslut

Answer 116

A

Ingen automation
Människan är fullt ansvarig för körning av bilen

Answer 117

A

Förarassistans
Stöttning i from av styrning och bromsning

Answer 118

A

Delvis automation
Föraren måste vara aktiv och redo att ta över körningen

Answer 119

A

Begränsad automation
Föraren måste vara beredd att ta över körningen om systemet ber om det

Answer 120

A

Hög automation
ODD (operativ design domän) - Bilen fungerar autonomt inom en förutbestämd miljö

Answer 121

A

Full automation
ej nått hit ännu

Answer 122

A

Skapar en gemensam standard för att beskriva autonomi

Answer 123

A

Säkerhetssystem som övervakar förarens beteende och uppmärksamhet
Används i bilar med nivå 2-3
Kameror riktade mot förarens ansikte för att spåra ögonrörelser, huvud position, blinkningar och ansiktsuttryck

Answer 124

A

ersätter backspeglar med kameror och digitala skärmar
Täcker fler vinklar och kan anpassas till olika ljusförhållanden samt tar mindre plats
Systemet kan ge varningar för andra fordon eller fotgängare

Answer 125

A

EU:s allmänna uppsättning av regeler och krv som syftar till att öka säkerhten för vägtrafikanter

Answer 126

A

Första steget i NPL
Delar upp text i mindre enheter tokens (meningar)

Answer 127

A

Tekniker för att representera ord i numeriska vektorer
Där ord med likdanande semantisk betydelse hamnar nära varandra i modellens minne

Answer 128

A

Encoder - Skapar en kontextuell representation av input
Decoder - Använder den tidigare skapade representationen för att generera utdata

Answer 129

A

NPL fick sitt stora genombrott 2017
Kan processa ord parallellt

Answer 130

A

I och med att transformerna processar ord parallellt, modellen information om ordens position i sekvensen
En unik vektor läggs därför till i varje word embedding baserat på dess position i sekvensen

Answer 131

A

Varje word embedding baseras på både position och innehåll

Answer 132

A

Varje ord representeras av en binär vektor där platsen ordet finns i sekvensen representeras av 1 och resten med 0

Answer 133

A

Word embeddings ger orden representationer av vektorer, där ord som liknar varandras får likdanande vektorer

Answer 134

A

Varje ord i sekvensen jämförs med resterande ord i modellen för att avgöra ordets betydelse i meningen
Modellen räknar sedan ut hur mycket uppmärksamhet/ attention varje ord ska ge de andra orden i sekvensen och omvandlas sedan nya representationer för varje ord
De nya representationerna bygger på Query - vad söker vi efter, key- vad har varje ord att erbjuda och Value - vad är själva innehållet
De nya vektorerna multipliceras sedan med inlärda vikt matriser
Softmax används sedan för att skapa en sannolikhet för varje representation

Answer 135

A

Query - Vad vi söker efter
Key - vad varje ord har att erbjuda
Value - Vad själva innehållet är

Answer 136

A

Flera paralella attention huvuden används för att fokusera på olika aspekter av meningen
t.ex syntax, semantik, kontext osv

Answer 137

A

Masken sätter alla framtida attention-vikter till 0 för att modellen inte ska veta vad som kommer som nästa ord utan den ska träna på att förutspå mönstret

Answer 138

A

De tidigare representationerna som gjorts i encodern placeras in.
Hämtar information i form av K och V från den tidigare representationen, medans Q alltså vad vi söker efter är information den plockar från sig själv
Kopplar ihop hela sekvenser och skapar representationer från olika sekvenser tillsammans

Answer 139

A

Finns efter varje attention block
Finns två fullt anslutna lager och ReLU funktion
Bearbetar varje token baserat på attention för att sedan kunna lära sig mönster

Answer 140

A

Följer en norm efter varje feed-forward och attention i transformerna för att stabilisera träningen

Answer 141

A

Kommer alltså i nummer och softmax genererar sedan de ordet som med stört sannolikhet ska genereras efter utifrån representationerna från attention lagrarna

Answer 142

A

Handlar om att göra ai begripligt och transparant för människor
Målet är att kunna förklara varför den fattat ett beslut

Answer 143

A

Handlar om hur väl modellen presenterar sin logisk på ett sätt människan förstår

Answer 144

A

Handlar om hur vida modellen fattar beslut som make sense i det specifika området

Answer 145

A

Hur modellen förklaras
a) Intrinsic Explainability (Inbyggd förklarbarhet)
b) Post-hoc Explainability (Förklaringar efteråt)

Answer 146

A

Hur förklaringen presenteras för användaren
a) Visual Explanations (För slutanvändare
b) Mathematical/Computational Explanations (För utvecklare
c) Language-Based Explanations (För slutanvändare

Answer 147

A

Modellen är designad för att vara självförklarande
Kräver ingen extra analys för att förstå beslutet
Använder t.ex beslutsträd

Answer 148

A

Komplexa modeller där beslutet inte är direkt tolkningsbart
Kräver en analys efter att modellen fattat ett beslut
Deep Learning modeller

Answer 149

A

En metod för att förklara hur neurala nätverk fattar beslut
Post -hoc används efter modellen har tränats
Specifik för neurala nätverk - model specifik kollar på hela modellen
Lokal - förklarar individuella förutsägelser

Answer 150

A

Post hoc
Lokal och global
model - agnostisk

Answer 151

A

Post hoc
model -specifik
global