NLP CHAT Flashcards

Question 1

Q

Vad är NLP och vad används det till?

Answer

A

Natural Language Processing (NLP) är en teknik för att analysera, förstå och generera mänskligt språk. Används för översättning, sentimentanalys, chatbots, etc.

Question 2

Q

Vad är tokenisering?

Answer

A

Processen att dela upp text i mindre delar (tokens) som kan vara tecken, ord eller subord.

Question 3

Q

Vad är en utmaning med ord-tokenisering?

Answer

A

Out of Vocabulary (OOV) problem - ord som inte finns i vokabulären kan vara svåra att hantera.

Question 4

Q

Vad är word embeddings?

Answer

A

Numeriska representationer av ord som gör att maskiner kan förstå semantiska relationer mellan ord.

Question 5

Q

Ge ett exempel på word embeddings-teknik.

Answer

A

One-hot vektorer, där varje ord representeras av en binär vektor med en enda 1:a.

Question 6

Q

Vad är en nackdel med one-hot vektorer?

Answer

A

De kräver mycket minne eftersom de har hög dimension.

Question 7

Q

Vad är encoder-decoder-arkitekturen?

Answer

A

En modell där en encoder bearbetar indata och en decoder genererar utdata, ofta använt i sekvens-till-sekvens-modeller som maskinöversättning.

Question 8

Q

Vad är en latent representation?

Answer

A

En kompakt representation av en sekvens som används av en decoder för att generera utdata.

Question 9

Q

Vad löser attention-mekanismen?

Answer

A

Den hanterar problemet med långa sekvenser genom att tilldela vikt till olika delar av indata vid varje tidssteg.

Question 10

Q

Vad är en transformer-modell?

Answer

A

En neural nätverksarkitektur som bygger på självuppmärksamhet (self-attention) och möjliggör parallell bearbetning.

Question 11

Q

Hur skiljer sig transformer-modeller från RNNs?

Answer

A

Transformers tillåter parallell bearbetning medan RNNs bearbetar sekvenser sekventiellt, vilket gör RNNs långsammare att träna.

Question 12

Q

Vad är en stor fördel med LLMs?

Answer

A

De kan användas för flera uppgifter (multitasking) och kan generalisera över olika domäner.

Question 13

Q

Vad är skillnaden mellan finetuning och prompting?

Answer

A

Finetuning innebär att man tränar om en LLM på en specifik dataset, medan prompting innebär att man ger extra instruktioner för att styra output utan att ändra modellen.

Question 14

Q

Vad är Chain of Thought (CoT)?

Answer

A

En prompting-teknik där modellen uppmanas att redogöra för sina tankesteg innan den ger ett slutligt svar.

Question 15

Q

Vad är Self-Ask?

Answer

A

En teknik där en LLM bryter ner en fråga i mindre delfrågor för att stegvis komma fram till svaret.

Question 16

Q

Vad är en traditionell chatbot jämfört med en modern AI-driven chatbot?

Answer

A

En traditionell chatbot använder fördefinierade svar medan en modern AI-driven chatbot genererar dynamiska svar baserat på kontext.

Question 17

Q

Vad är Turing-testet?

Answer

A

Ett test där en dator försöker övertyga en mänsklig domare att den också är en människa.

Question 18

Q

Vad är en foundation model?

Answer

A

En stor språkmodell (LLM) som kan generalisera över många olika uppgifter och inte är begränsad till en specifik funktion.

Question 19

Q

Nämn en utmaning med att träna LLMs från grunden.

Answer

A

Det kräver extremt mycket beräkningskraft och resurser eftersom modellerna har miljarder/triljoner parametrar.

Question 20

Q

Hur kan LLMs användas inom sjukvård?

Answer

A

De kan användas i expertssystem, diagnostik och rekommendationer inom sjukvård.