Ai 2 Flashcards
Vilken rang har skalärer?
Rang 0, ensam siffra
Vilken rang har vektorer?
Rang 1, en lista (rad eller kolumn)
Vilken rang har matriser?
Rang 2, en tabell
Vilken rang har tensorer/matrissekvenser?
Rang 3 (3+, flerdimensionella strukturer)
Vad är Dot Product/ skalärprodukt och hur räknas man ut detta?
= Weighted sum, består av vektorer och viktade vektorer.
Skalärprodukten räknas ut såhär: första vikten · första koordinaten, andra vikten · andra koordinaten osv…(w1 · x1)
Vad gör numpy metoden ‘’ndim’’?
Tar fram vilken rang skalären/vektoren/matrisen m.m har
Vad är en tangent line?
En tangentlinje (eller tangent) är en rät linje som berör en kurva vid en viss punkt, och har samma lutning som kurvan just vid den punkten
Vad används optimeringfunktionen Gradient descent till?
Inom maskininlärning används den främst för att minimera förlustfunktionen (loss function) i en modell.
Optimeringsalgoritm
Vad är en Feature extractor network (FEN)?
Är en del av ett neuralt nätverk som automatiskt hittar viktiga mönster (features) i data. Kan exempelvis vara kanter, former m.fl
Vad är Spatial invariance?
Om du har en bild av en katt, så kommer en modell med Spatial invariance att kunna känna igen katten om den är i mitten, i hörnet eller på någon annan plats i bilden
Vad gör Feature detectors (filters/kernels)?
De används för att analysera små delar av en bild i taget. Tidigare lager i nätverket fokuserar på enklare features (t.ex kanter), medan senare lager känner igen hela objekt
Vad gör en pooling map?
En pooling map minskar bildens storlek genom att sammanfatta information från små områden (t.ex. max pooling)
Vad innebär downsampling?
Är processen att minska storleken på data, vanligtvis genom att reducera upplösningen eller antalet datapunkter. Inom maskininlärning och datorseende används downsampling ofta för att minska mängden beräkningsresurser som krävs för att behandla data
Vad gör en classifier?
En classifier tilldelar inputdata till en specifik kategori eller klass. (t.ex katt eller hund)
Vad gör ett Task-specific network (TSN)?
Ett TSN är ett nätverk designat för att lösa en specifik uppgift, som klassificering, regression, objektigenkänning, översättning, etc.
Vad är skillnaden mellan image classification och object detection?
Image classification = Har som mål att förutse objektets typ/class
Object detection = Har som mål att förutse objektets plats på bilden genom boundingboxes
Nämn några objekts detection challenges
Objectivness (distinguishing objects presence from background)
Localization
Classification
Evaluation (speed versus accuracy)
Overlapping boundning boxes
Vad är en Single Shot multiBox Detector?
En djupinlärningsbaserad objektidentiferingsmodell som används för att detektera och klassificera flera objekt i en bild eller video i realtid
Vad är speciellt med en Chain of thought modell (CoT)?
Istället för att ge det direkta svaret visar den hur den ‘’tänker’’.
Fråga: Om Anna har 3 äpplen och köper 5 till, hur många har hon totalt?
Vanlig AI-modell: Svar: 8
AI med Chain of Thought:
1. Anna har 3 äpplen.
2. Hon köper 5 till.
3. Totalt har hon 3+5=8 äpplen.
Vad är ett Driver Monitoring System (DMS)?
Ett säkerhetssystem i fordon som övervakar förarens uppmärksamhet och tillstånd för att förhindra olyckor.
Vad är målet med maskininlärning?
Prediktion och god generalisering.
Vad gör ett träningsdataset?
Används för att träna modellen genom att justera dess parametrar.
Vad gör ett valideringsdataset?
Används för att finjustera modellen och undvika överanpassning.
Vad gör ett Testdataset?
Används för att utvärdera modellens prestanda på ny, osedd data.
Vad innebär generaliserbarhet inom maskininlärning?
Modellens förmåga att prestera väl på data som den tidigare inte har sett.
När modellen effektivt fångar de underliggande mönstren i datan.
Vad innebär optimering inom maskininlärning?
Processen att minimera felet eller förlustfunktionen för träningsdata. Görs genom att justera modellens parametrar för att passa träningsdata.
Vad är och hur uppstår Overfitting?
När en modell lär sig ‘’brus’’ eller detaljer i träningsdatan, vilket minskar dess förmåga att generalisera.
Uppstår när modellen är för komplex i förhållande till mängden träningsdata/ den är för nära träningsdatan och fångar irrelevanta detaljer.
Vad är och hur uppstår Underfitting?
När en modell är för enkel (eller otränad/ooptimerad) för att fånga mönster i datan.
Modellen har inte lärt sig tillräckligt från datan vilket leder till dålig prestanda
Vad är nack och fördelen med brus i datan?
Fördel - Brus (varians) kan förbättra generaliseringen
Nackdel - För mycket brus kan göra det svårt att anpassa en bra modell
Vad är The Manifold Hypothesis?
Manifold-hypotesen säger att högdimensionell data (t.ex. bilder eller text) i verkligheten ligger på en mycket lägre dimensionell yta, en manifold, inbäddad i det högdimensionella rummet.
Istället för att leta i en kaotiskt hög av information, försöker AIn hitta osynliga vägarna, där datan faktiskt ligger.
Vad är Simple holdout validation?
Delar upp datasetet i två delar: en träningsdel (80%) och en testdel (20%). Modellen tränas på den ena och testas på den andra. Snabb men kan ge varierande resultat beroende på hur datan delas upp.
Vad är K-fold validation?
Delar upp datasetet i K lika stora delar. Modellen tränas och testas K gånger, där varje del används som testdata en gång. Ger mer pålitlig utvärdering eftersom alla datapunkter testas.
Vad är Gradient Descent (GD)?
Är en optimeringsalgoritm som uppdaterar modellens parametrar genom att beräkna gradienten av förlustfunktionen över hela träningsdatan.
Vad är Stochastic Gradient Descent (SGD)?
En variant av GD som tränar maskininlärningsmodeller genom att justera parametrar stegvis. Snabbare än GD men mer varierande/’’bullrig’’, eftersom den uppdaterar parametrarna baserat på enstaka eller små batchar av träningsdata. Bra när man har stor mängd träningsdata.
Vad är Adaptive Moment Estimation (ADAM)?
En avancerad optimeringsalgoritm som kombinerar momentum och adaptiv inlärningstakt för snabbare och stabilare konvergens (att närma sig en lösning).
Vad är en epok?
En fullständig genomgång av hela datasetet.
Vad är Batch size?
Är antalet träningsdataexempel som används i en enda iteration (eller “batch”) när modellen uppdaterar sina vikter under träning.
Vad är iteration?
Är genomgången av en enda batch genom modellen (till skillnad från epok som är genomgången av hela datasetet).
Vad är Momentum?
Momentum är en teknik som hjälper modellen att fortsätta röra sig i rätt riktning genom att använda tidigare uppdateringar för att ge mer fart och stabilitet under träningen. Att använda tidigare uppdateringar betyder att optimeringsalgoritmen inte bara tittar på den aktuella gradienten för att justera vikterna, utan även tar hänsyn till hur vikterna har förändrats i föregående steg.
Vad gör optimeringsalgoritmen RMSprop?
Justerar inlärningstakten för varje parameter baserat på de senaste gradienternas storlek, vilket gör inlärningen mer stabil. Den hjälper till att hantera stora gradienter och gör träningen snabbare och mer effektiv för komplexa modeller.
Vad är ett Dense layer?
Fullt ihopkopplat lager där varje neuron är ansluten till alla neuroner i föregående och nästa lager
Vad är ett Flatten layer?
Omvandlar en flerdimensionell tensor till en 1D-array, t.ex. en 28 × 28
28×28-matris blir 784 noder
Vad är och gör Softmax-funktionen?
En aktiveringsfunktion. Omvandlar logits till sannolikheter så att summan blir 1, används ofta i klassificering
Vad är och gör ReLU-funktionen?
Aktiveringsfunktion som sätter negativa värden till 0 och behåller positiva, vilket hjälper vid djupa nätverk
Vad är loss?
Ett mått på felet i modellen baserat på träningsdata
Vad är val_loss?
Ett mått på felet i modellen baserat på valideringsdata
Vad är accuracy?
Andelen korrekta förutsägelser på träningsdata.
Vad är val_accuracy?
Andelen korrekta förutsägelser på valideringsdata, indikerar modellens förmåga att generalisera.
Vad är Single Layer Perceptron (SLP)?
Ett neuralt nätverk med endast ett lager av neuroner mellan input och output. Det kan endast lösa linjärt separerbara problem
Vad är Multi Layer Perceptron (MLP)?
Ett neuralt nätverk med minst ett dolt lager mellan input och output. Det kan lösa mer komplexa, icke-linjära problem. Används för handskriftsigenkänning, t.ex. att tolka siffror i MNIST-datasetet.
Vad är Artificial Neural Network (ANN)?
En generell term för neurala nätverk inspirerade av hjärnans neuroner, där information bearbetas genom sammanlänkade lager av noder
Vad är Recurrent Neural Network (RNN)?
Ett neuralt nätverk som har återkopplingar, vilket gör att det kan hantera sekventiell data genom att minnas tidigare indata. Används i textgenerering och taligenkänning, t.ex. för att förutsäga nästa ord i en mening
Vad är Convolutional Neural Network (CNN)?
Ett neuralt nätverk optimerat för att analysera visuella data genom att extrahera viktiga mönster med konvolutionella filter. Används i ansiktsigenkänning och bildklassificering, t.ex. för att känna igen djur i bilder
Vad är Large Language Model (LLM)?
Ett stort neuralt nätverk tränat på enorma mängder textdata för att förstå och generera språk.
Används i chattbotar och översättningstjänster, t.ex. GPT-modeller som skapar textbaserade svar
Vad är “The Credit Assignment Problem”?
Utmaningen att bestämma vilka specifika vikter i ett neuralt nätverk som är ansvariga för fel när nätverket producerar felaktig output. I SLPs existerar inte detta problem eftersom det bara finns ett lager av vikter att justera. Men i MLPs kan fel härröra från vilket lager som helst, vilket gör det svårt att veta exakt vilka vikter som måste justeras
Hur löser man ‘‘The Credit Assignment Problem?
Backpropagation löser detta genom att:
- Beräkna hur stort felet är (hur mycket erhållen output skiljer sig från förväntat output).
- Propagera felet från outputlagret baklänges genom nätverket, lager för lager.
- Justera vikterna med hjälp av gradient descent
Vad innebär Boolean Operator ‘’AND’’?
Båda måste vara sanna för att resultatet ska bli sant.
Exempel: True AND False = False
Vad innebär Boolean Operator ‘’OR’’?
Minst en måste vara sann för att resultatet ska bli sant.
Exempel: True OR False = True
Vad innebär Boolean Operator ‘’XOR’’?
Endast en får vara sann, inte båda.
Exempel: True XOR True = False, men True XOR False = True.
Vad är en Confusion Matrix?
En confusion matrix är en tabell som används för att utvärdera prestandan hos en klassificeringsmodell. Den visar antalet korrekta och felaktiga förutsägelser genom att jämföra modellens output med de faktiska värdena
Vad är Keras?
Är ett användarvänligt och modulärt bibliotek för att bygga och träna neurala nätverk i Python. Det fungerar ovanpå TensorFlow och gör det enklare att skapa och experimentera med djupa neurala nätverk
Varför är Multiscale Detection viktigt?
- Objekt kan förekomma i olika storlekar
- Mindre objekt kan annars gå förlorade i djupa CNNs
- Bättre precision för objekt i varierande perspektiv
- Snabbare och mer robust detektering
Vad innebär stride = 1?
Stride = 1 betyder att filtret i ett Convolutional Neural Network (CNN) förflyttas ett steg i taget över inputbilden, vilket leder till en mer detaljerad feature map.
Kan vara Stide = 2, 3, 4… osv
Vad gör ett filter i ett CNN?
Ett filter (även kallat kernel) är en liten matris som sveper över inputbilden och identifierar mönster, som kanter eller texturer
Vad innebär Fine-tuning?
Fine-tuning innebär att man justerar en redan tränad modell genom att uppdatera dess vikter med ny data
Vad innebär Prompt Engineering?
Prompt Engineering handlar om att formulera inmatningstext (prompter) på ett sätt som styr modellens svar utan att ändra dess vikter. Exempel: Skriva en tydlig prompt för en språkmodell så att den genererar en sammanfattning istället för en förklaring
Vad gör en Encoder?
En encoder omvandlar inputdata till en kompakt representation (latent space) som bevarar dess viktigaste egenskaper. Exempel: I en översättningsmodell kodar en encoder en mening från svenska till en abstrakt representation
Vad gör en Decoder?
En decoder tar den kompakta representationen från encodern och omvandlar den tillbaka till en förståelig output. Exempel: I en översättningsmodell avkodar en decoder representationen till en mening på engelska
Vad är Residual Attention?
Det är en teknik som kombinerar attention-mekanismer med residual connections för att förbättra inlärning och stabilitet i neurala nätverk, särskilt i Transformers.
Vad gör Attention i en transformer?
Attention hjälper modellen att fokusera på viktiga delar av input genom att beräkna vikter mellan olika ord i en sekvens.
Vad gör Norm-lagret i en transformer?
Normaliserar aktiveringar i nätverket för att stabilisera träningen och snabba upp inlärningen.
Vad innebär positional encoding?
Lägger till information om ordens position i en sekvens, eftersom transformers inte har en inbyggd ordning som RNN.
Vad är Multi-Headed Attention?
Multi-Headed Attention innebär att en modell använder flera “huvuden” för att fokusera på olika delar av en sekvens samtidigt. Det hjälper nätverket att fånga mer komplexa samband
Vad är Multi-Headed Cross-Attention?
Används när en modell ska uppmärksamma en annan sekvens (t.ex. input från en annan språkmodell vid översättning). Flera huvuden gör att olika delar av input kan påverka output samtidigt
Vad är Self-Attention?
En mekanism där en sekvens uppmärksammar sig själv, dvs. varje ord i en mening väger hur mycket det ska påverkas av andra ord i samma mening
Vad är Multi-Headed Self-Attention?
En förbättrad variant av Self-Attention där flera huvuden fokuserar på olika relationer inom samma sekvens. Detta ger en djupare förståelse av sammanhanget
Vad gör Query i en transformer?
Query (Q) är det som används för att söka efter relevanta delar av input i Attention-mekanismen
Vad gör Key i en transformer?
Key (K) är referenspunkterna som används för att jämföra mot Query och avgöra vilka delar av sekvensen som är viktiga
Vad gör value i en transformer?
Value (V) är den faktiska informationen som hämtas baserat på matchningen mellan Query och Key
Vad är explainable AI (XAI)?
XAI (Explainable AI) är metoder och tekniker som gör AI-modellers beslut mer begripliga för människor.
Exempel: Används i medicinska AI-system för att förklara varför en patient klassificeras som hög eller låg risk
(XAI) Vad är Comprehensibility?
Kan modellen presentera sina förutsägelser på ett sätt som är förståeligt för användaren?
(XAI) Vad är Interpretability?
Är modellens förklaringar logiska och relevanta inom det specifika användningsområdet?
Vad är SHAP (SHapley Additive exPlanations)?
SHAP är en metod för att förklara hur mycket varje input-faktor bidrar till en modells prediktion. Den bygger på Shapley-värden från spelteori och ger insikt i modellens beslut.
Exempel: Används för att förstå varför en AI-modell klassificerar en låneansökan som godkänd eller nekad
Vad är en model explainer?
En model explainer är en metod eller algoritm som hjälper oss förstå varför en AI-modell gör sina prediktioner.
Exempel: SHAP och LIME är vanliga model explainers som används i XAI (Explainable AI)
Vad är Intrinsic och Post hoc explainability?
Intrinsic: Modellen är optimerad för både prestanda och förklarbarhet.
Post hoc: Förklarbarhet läggs till efter träning med XAI-algoritmer
Vad är Global och Local explainability?
Global: Förklarar modellen över hela datasetet.
Local: Förklarar modellen för specifika datapunkter.
Vad är Model-agnostic och Model-specific explainability?
Model-agnostic: Förklarar bara input-output-relationen, oberoende av modellens inre funktion.
Model-specific: Förklarar även modellens inre representationer och beräkningar
Vad är The Sigmoid Function?
Sigmoid-funktionen är en aktiveringsfunktion som används i neurala nätverk för att omvandla ett värde till ett intervall mellan 0 och 1