10. NLP - AI II Flashcards

Question 1

Q

Vad står NLP för?

Answer

A

Natural Language Processing

Question 2

Q

Vilka är de huvudsakliga utvecklingsfaserna inom NLP?

Answer

A

Regelbaserade metoder (1950–1980-tal)
Statistiska metoder & neurala nätverk (1980-tal–2000-tal)
Deep Learning & neurala nätverk (2000–2018)
Stora språkmodeller (LLMs) (2019–nu)

Question 3

Q

Vilka viktiga händelser skedde inom NLP på 1950–1980-talet? Vilken metod dominerade NLP under denna period?

Answer

A

Noam Chomsky publicerar “Syntactic Structures” (1957)
ALPAC-rapporten ifrågasätter maskinöversättningens potential (1966)

Vilken metod dominerade NLP under denna period?
Regelbaserade system

Question 4

Q

Statistiska metoder & neurala nätverk (1980–2000-tal) Vilka tekniker blev populära under denna period?

Answer

A

Återkommande neurala nätverk (RNNs) (1985)
Hidden Markov Models (HMMs) för taligenkänning (1989)
Long Short-Term Memory (LSTM) förbättrar RNNs (1997)

Question 5

Q

Deep Learning & neurala nätverk (2000–2018)
Vilka genombrott markerade denna period?

Answer

A

Word embeddings (Word2Vec) (2013)
Sekvens-till-sekvensinlärning & transformerarkitektur (2014)
Google publicerar “Attention Is All You Need” (2017)
Förtränade språkmodeller som BERT och GPT börjar utvecklas (2018)

Question 6

Q

Vad innebär maskinöversättning inom NLP? (Translation)

Answer

A

Automatiserad översättning av text utan mänsklig assistans.

Question 7

Q

Stora språkmodeller (LLMs) (2019–nu)
Vilka är några av de stora språkmodellerna som har utvecklats sedan 2019?

Answer

A

RoBERTa, DeBERTa, GPT-2 (2019)
GPT-3, T5, GPTNeo (2020–2021)
PaLM, BLOOM, ChatGPT (2022)
GPT-4, Claude, LLaMA, Bard (2023)

Question 8

Q

Vilka är några vanliga användningsområden för NLP?

Answer

A

Maskinöversättning
Text-till-tal (TTS)
Sentimentanalys
Chatbots

Question 9

Q

Ge exempel på några verktyg som används för maskinöversättning?

Answer

A

Google Translate
Microsoft Translate
DeepL
IBM Watson

Question 10

Q

Vilka olika typer av översättning kan NLP hantera?

Answer

A

Text-till-text (TTT)
Tal-till-tal (S2S)
Text-till-tal (TTS)
Tal-till-text (STT)

Question 11

Q

Vad är voice-cloning?

Answer

A

Teknik för att efterlikna en specifik persons röst med hjälp av NLP.

Question 12

Q

Vad är sentimentanalys inom NLP?

Answer

A

Att analysera text för att bestämma om innehållet är positivt, negativt eller neutralt.
Fungerar genom att identifiera och vikta positiva och negativa ord för att beräkna en övergripande sentimentpoäng.

Question 13

Q

Vad är syftet med text-till-tal (TTS)? Vilka exempel på TTS-system finns?

Answer

A

Att omvandla skriven text till tal

Siri
Alexa
Google Translate
OpenAI:s TTS

Question 14

Q

Vad är en chatbot? Ge exempel på en chatbot och vilka funktioner kan en chatbot ha?

Answer

A

En AI-driven applikation som kan interagera med användare via text eller tal

ChatGPT

Text-till-text interaktion
Användning av olika språkmodeller (LLMs) som GPT-3 och GPT-4
Minnesfunktioner för kontextförståelse
Möjlighet att beskriva visuella medier

Question 15

Q

Vad används NLP och stora språkmodeller till?

Answer

A

Generell chatt
Informationssökning
Tekniska och programmeringsrelaterade frågor
Kreativa syften, såsom poesi och fiktion
Hjälp med studier och uppgifter

Question 16

Q

Vad är tokenization?

Answer

A

Processen att dela upp text i mindre enheter (tokens) som kan vara ord, subord eller tecken

Question 17

Q

Vad är word embeddings?

Answer

A

Numeriska representationer av ord som fångar deras semantiska relationer i en flerdimensionell vektorrum

Question 18

Q

Vilka är några vanliga NLP-arkitekturer?

Answer

A

Sequence-to-sequence (seq2seq)
Encoder-decoder arkitekturer
Modeller som endast använder en encoder eller decoder

Question 19

Q

Varför behövs tokenization i NLP?

Answer

A

För att omvandla text till en form som maskiner kan bearbeta, genom att konvertera ord till siffror

Question 20

Q

Vilka fördelar och nackdelar har character-based tokenization?

Answer

A

Färre unika tokens behövs (bara alfabetet och specialtecken)
Kräver många tokens för att representera långa sekvenser
Svårt att fånga semantisk betydelse av enskilda tecken

Question 21

Q

Vilka typer av tokens kan användas?

Answer

A

Tecken (characters): Varje enskild bokstav eller symbol blir en token
Ord (words): Hela ord används som tokens
Subord (subwords): Ord delas upp i mindre delar för att hantera oregelbunden stavning och nya ord

Question 22

Q

Vilka fördelar och nackdelar har word-based tokenization?

Answer

A

Fångar hela ords betydelse direkt
Svårt att hantera out-of-vocabulary (OOV) ord

Question 23

Q

Vad är subword tokenization och varför används det?

Answer

A

En kompromiss mellan character och word tokenization
Kan hantera nya ord genom att känna igen vanliga morfologiska delar som suffix och prefix
Exempel: Ordet “fascination” kan delas upp i [“fas”, “cina”, “tion”]

Question 24

Q

Vad är syftet med word embeddings i NLP?

Answer

A

Word embeddings används för att representera ord som numeriska vektorer, vilket gör det möjligt för maskininlärningsmodeller att förstå semantiska relationer mellan ord.

Question 25

Q

Vad är en one-hot vektor?

Answer

A

En binär vektor där endast en position har värdet 1, medan resten är 0.

Question 26

Q

Vad är problemet med one-hot encoding?

Answer

A

Kräver en stor vektordimension för att representera hela ordförrådet.
Kan inte fånga relationer mellan ord.

Question 27

Q

Vad är en fördel med real-number embeddings?

Answer

A

Mindre vektordimension behövs jämfört med one-hot encoding.
Kan representera semantiska relationer mellan ord.

Question 28

Q

Hur skiljer sig real-number embeddings från one-hot encoding?

Answer

A

One-hot encoding representerar ord med binära vektorer.
Real-number embeddings använder decimalvärden och kan bevara relationer mellan ord.

Question 29

Q

Hur kan ord representeras i real-number embeddings?

Answer

A

Exempel:
Electronics: [0.9, 0.1, 0.3]
Furniture: [0.8, 0.2, 0.4]
Clothing: [0.1, 0.9, 0.2]

Question 30

Q

Hur stor kan en embedding-vektor vara i praktiken?

Answer

A

Den kan ha hundratals eller tusentals dimensioner för att fånga komplexa semantiska samband mellan ord.

Question 31

Q

Vad är en viktig egenskap hos word embeddings?

Answer

A

De lär sig relationer mellan ord genom att placera semantiskt lika ord närmare varandra i vektorrummet.

Question 32

Q

Vad används word embeddings för i NLP?

Answer

A

Förståelse av naturligt språk i maskininlärningsmodeller.
Förbättrad textanalys och sökmotorer.
Översättning, chatbotar och sentimentanalys.

Question 33

Q

Skillnaden enkelt?

Answer

A

One-hot encoding = Orden bor i separata hus, inget samband mellan dem.

Word embeddings = Orden bor på en karta där liknande ord ligger nära varandra.

Question 34

Q

Vad betyder seq2seq i NLP?

Answer

A

Seq2seq (Sequence-to-Sequence) är en modellarkitektur som används för att konvertera en sekvens av ord till en annan, t.ex. vid maskinöversättning.

Question 35

Q

Vad gör en Encoder-Decoder-modell?

Answer

A

Encoder: Tar in en sekvens av ord och omvandlar dem till en kodad representation (embeddings).
Decoder: Tar den kodade representationen och genererar en ny sekvens, t.ex. en översättning.

Question 36

Q

Hur används seq2seq i maskinöversättning?

Answer

A

Encoder: Tar en mening, t.ex. “Nice to meet you”, och omvandlar den till en intern representation.
Decoder: Tar denna representation och producerar en ny mening på målspråket, t.ex. “Ravi de vous rencontrer” på franska.

Question 37

Q

Varför används LSTMs i seq2seq?

Answer

A

LSTMs (Long Short-Term Memory) är en typ av återkommande neuralt nätverk (RNN) som hjälper modellen att förstå sammanhang i en sekvens genom att hålla kvar relevant information längre.

Question 38

Q

Vad händer i slutet av en encoder i seq2seq?

Answer

A

Encodern skapar en latent representation av hela sekvensen, en sorts kodad sammanfattning som decodern sedan använder för att generera en ny mening.

Question 39

Q

Nämn några användningsområden för seq2seq-modeller.

Answer

A

Maskinöversättning (Google Translate)
Textsummering
Automatiska chattbotar
Taligenkänning

Question 40

Q

Vilket är ett stort problem med vanliga seq2seq-modeller?

Answer

A

Modellen kan ha svårt att hantera långa sekvenser eftersom den sammanfattar all information i en enda representation. Moderna modeller använder attention-mekanismer (t.ex. Transformer) för att lösa detta.

Question 41

Q

Vad är en LSTM (Long Short-Term Memory) och varför används den i seq2seq-modeller?

Answer

A

LSTM är en recurrent neural network (RNN)-typ som hjälper modeller att komma ihåg tidigare ord i en sekvens under längre tid.

De används i seq2seq-arkitekturer för att hantera sekvensbaserade uppgifter, som översättning eller textgenerering.

Question 42

Q

Hur fungerar en LSTM-cell vid varje steg i en sekvens?

Answer

A

Tar in ett ord vid en viss tidpunkt (t.ex. “Nice”).
Behåller viktig information från tidigare steg.
Uppdaterar sin interna minnescell baserat på nuvarande och tidigare information.
Skickar vidare en uppdaterad representation till nästa cell i sekvensen.

Question 43

Q

Vad gör Encodern i en seq2seq-arkitektur?

Answer

A

Tar in en sekvens av ord (ex: “Nice to meet you”).
Omvandlar den till en latent representation (en sammanfattad vektor av meningen).
Skickar den vidare till Decodern.

Exempel:
In: “Nice to meet you” → Encoder → [Latent vektor]

Question 44

Q

Vad gör Decodern i en seq2seq-modell?

Answer

A

Tar emot latent vektorn från Encodern.
Använder den för att generera en ny sekvens (t.ex. översättning till franska).
Exempel:
Latent representation → Decoder → “Ravi de vous rencontrer”

Question 45

Q

Vad är en latent vektor (context vector) i en seq2seq-modell?

Answer

A

Det är en sammanfattning av hela den inmatade sekvensen.
Den innehåller all viktig information som behövs för att generera den nya sekvensen.
Exempel:
Engelska: “Nice to meet you”
Latent vektor: [0.85, -0.42, 1.23, …]
Franska output: “Ravi de vous rencontrer”

Question 46

Q

Hur används latent vektorer i neural machine translation (NMT)?

Answer

A

Encodern skapar en latent representation av indata.
Decodern tolkar den för att generera en översättning.
Vektorn fungerar som en “överblick” över hela meningen!
Exempel:

In: “I am a student” → [Latent vektor] → Ut: “Je suis étudiant”

Question 47

Q

Vad betyder LLM?

Answer

A

LLM står för “Large Language Model”, vilket är stora språkmodeller som används för att förstå och generera mänskligt språk.

Question 48

Q

Vad är ett RNN (Recurrent Neural Network)?

Answer

A

Ett RNN är en typ av neuralt nätverk som kan hantera sekventiella data genom att återanvända information från tidigare steg i en sekvens.

Question 49

Q

Vilka är nackdelarna med RNNs och LSTMs i seq2seq-arkitekturer?

Answer

A

De är långsamma att träna.

De lider av “vanishing gradient problem”, vilket gör det svårt att lära sig långa sekvenser.

LSTM hjälper delvis med detta men är fortfarande begränsat i sin kapacitet.

Question 50

Q

Vad är “Attention” i NLP?

Answer

A

Attention är en mekanism som gör att en modell kan fokusera mer på vissa delar av en sekvens vid bearbetning, istället för att endast använda den sista dolda representationen.

Question 51

Q

Vad är skillnaden mellan traditionella seq2seq-modeller och modeller med attention?

Answer

A

I traditionella seq2seq-modeller används endast den sista dolda representationen från encodern.

I modeller med attention används alla dolda representationer från varje steg, vilket förbättrar förståelsen och översättningen.

Question 52

Q

Varför behöver vi “attention weighting” vid översättning?

Answer

A

För att vi inte alltid översätter ord för ord. Attention hjälper modellen att avgöra vilka delar av en mening som är viktigast att fokusera på vid översättning.

Question 53

Q

Vad är en transformer?

Answer

A

En transformer är en typ av neuralt nätverk som använder self-attention och helt undviker rekurrenta anslutningar (som i RNNs), vilket gör det snabbare och mer effektivt att träna.

Question 54

Q

Varför är transformers bättre än RNNs?

Answer

A

De är snabbare att träna eftersom de kan bearbeta alla ord i en mening parallellt.

De är enklare att träna eftersom de fokuserar på viktiga delar av inputen via attention-mekanismer.

De kan hantera längre sekvenser och sammanhang bättre än RNNs.

Question 55

Q

Vad innebär self-attention i en transformer?

Answer

A

Self-attention innebär att varje ord i en sekvens jämförs med alla andra ord i sekvensen, så att modellen kan förstå vilka delar av texten som är mest relevanta för varje ord.

Question 56

Q

Vad är “Context Vector” i en transformer?

Answer

A

En context vector är en representation av hela input-sekvensen, där varje ord har fått olika viktningar beroende på sin relevans för översättningen.

Question 57

Q

Vad betyder det att transformers kan köra parallell beräkning?

Answer

A

Till skillnad från RNNs, där ord bearbetas ett i taget, kan transformers hantera hela sekvensen på en gång, vilket gör dem betydligt snabbare.

Question 58

Q

Vad är en feed-forward nätverksdel i en transformer?

Answer

A

Det är en komponent i varje lager av transformern som hjälper till att bearbeta och justera vikterna efter self-attention-mekanismen.

Question 59

Q

Vad är en kort historik över LLMs?

Answer

A

LLMs (Large Language Models) har utvecklats från regelbaserade system (t.ex. Eliza 1967) till moderna transformerbaserade modeller som GPT-4 och BERT.

Question 60

Q

Vad är skillnaden mellan traditionella chatbots och moderna konversations-AI?

Answer

A

Traditionella chatbots använder fasta regler och skript, medan moderna AI-modeller som BERT och ChatGPT använder maskininlärning och NLP för att generera svar.

Question 61

Q

Nämn två exempel på traditionella chatbots och deras egenskaper.

Answer

A

Eliza: Regelbaserad chatbot som simulerar en psykolog.

Alice: Heuristisk chatbot som bygger på regler men är mer avancerad än Eliza.

Question 62

Q

Vilka är några av de moderna konversations-AI-modellerna?

Answer

A

BERT (Google): Transformerbaserad modell för språkförståelse.

LLaMa (Meta): Öppen källkod LLM.

ChatGPT (OpenAI): GPT-baserad chatbot.

Bard/Gemini (Google): Avancerad AI för konversation.

Question 63

Q

Vad är fördelarna och nackdelarna med Conversational AI jämfört med traditionella AI-chatbots?

Answer

A

Conversational AI: Fördelar: Naturligare interaktioner, anpassningsförmåga, lär sig över tid. Nackdelar: Kräver mer data och avancerad teknik.

Traditionell AI: Fördelar: Lättare att implementera, billigare. Nackdelar: Begränsade funktioner, kan inte hantera komplexa frågor.

Question 64

Q

Vad är Turing-testet?

Answer

A

Ett test för att avgöra om en dator kan efterlikna mänsklig intelligens genom att övertyga en mänsklig domare att den är människa.

Answer 65

A

Omvänt Turing-test: Människa försöker bevisa för en dator att den är människa (ex. CAPTCHA).

Totalt Turing-test: Testar även sensoriska och motoriska färdigheter.

Minimum Intelligent Signal Test: Endast ja/nej-frågor används.

Answer 66

A

LLMs: Fokuserar på specifika uppgifter som översättning eller chatbot-konversationer.

Foundation models: Kan generalisera över flera uppgifter och närma sig AGI (Artificial General Intelligence).

Answer 67

A

Kommer AI att passera Turing-testet?

Kan AI nå AGI och överträffa mänskliga förmågor?

Kommer AI att skapa eller ta över jobb?

Vill vi ha AI överallt för maximal effektivitet och säkerhet?

Answer 68

A

Re-train from scratch

Finetuning

Prompt Engineering

Answer 69

A

Att träna en LLM från början med en helt ny dataset, vilket kräver mycket data och beräkningskraft.

Answer 70

A

Finetuning är att ta en redan tränad LLM och anpassa den till en specifik dataset för bättre prestanda på en viss uppgift.

Answer 71

A

Risk för överanpassning (overfitting) till den nya datan och minskad generaliseringsförmåga.

Answer 72

A

Att förbättra modellens svar genom att ge mer specifika instruktioner i prompten utan att ändra själva modellen.

Answer 73

A

Att öka förtroendet för LLM:s svar och förbättra dess prestanda genom att guida den att tänka steg för steg.

Answer 74

A

Chain-of-thought (CoT)

Self-ask

ReAct

Iterative prompting

Sequential prompting

Answer 75

A

En teknik där modellen uppmanas att resonera steg-för-steg för att öka förståelsen och noggrannheten i svaret.

Answer 76

A

En metod där modellen bryter ner en fråga i mindre delproblem för att förbättra noggrannheten i svaret.

Answer 77

A

En strategi där modellen både förklarar sitt resonemang (Re) och vidtar åtgärder (Act), t.ex. att söka information.

Answer 78

A

Genom att strukturera frågor och instruktioner så att modellen får en tydligare kontext och kan generera bättre svar inom det önskade området.

Answer 79

A

Expert Systems (t.ex. Healthcare, Recommender Systems, Education)
Virtuella assistenter (t.ex. Customer Service)
Sentimentanalys (t.ex. identifiera ohyfsade kommentarer online)
Kodutveckling (t.ex. GitHub Copilot, ChatGPT)

Answer 80

A

Talbaserad interaktion och resonemang
Stöd för komplexa uppgifter i fysiska miljöer
Begränsningar: LLMs saknar självmedvetenhet och intelligens som en människa

Answer 81

A

Assistenter i bilar (t.ex. Nio’s Nomi, Nvidia’s LLada)
Ger information om nya miljöer och säkerhetsrisker
Kan fungera som en följeslagare under körning

Answer 82

A

Enkla chatbots har funnits sedan AI:s början
NLP förbättrades med djupa neurala nätverk (ANNs)
Transformermodeller (t.ex. LLMs) revolutionerade AI
Modern användning inkluderar generellt intelligenta AI-system samt domänspecifika specialiseringar

Brainscape's Knowledge GenomeTM

10. NLP - AI II Flashcards

Brainscape's Knowledge Genome^TM