Natural language processing Flashcards

1
Q

Natural language processing

A

Går ut på att FÖRSTÅ och GENERERA mänskligt språk på ett meningsfullt och användsbart sätt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Lexical analys

A

Bryta ner till tokens, mindre betydelsefulla delar
- ord
- typ av ord, verb?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Syntaktisk analys

A

Delar av meningar
- Fraser
- Syntaxer

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Semantisk analys

A

Förstå innebörden av ord och meningar

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Pragmatisk analys

A

Förstå språket i dess kontext
- Vad betyder det, språket bakom orden
- “Oj vad kallt det är när fönstret är öppet”

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Bag of words model

A

Grunläggande teknik för presentera text
- Enklaste modellen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q
  1. Corpus , BOW
A

Samlingen av all text som ska analyseras, skapar ett ordförråd utifrån all text
- Som en lista med alla ord

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q
  1. Tokenisering, BOW
A

Varje ord blir en egen token
“Katten åt musen” blir
“katten” “åt” “musen”

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q
  1. Vektorisering, BOW
A

Varje token får ett numeriskt värde utifrån dess frekvens.
Ett ord som nämns 3 gånger får värdet “3”

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Vad är syftet med Bag of words model?

A

Kunna använda text i maskininlärningsalgoritmer

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Textsammanfattning

A

Algoritm för att analysera innehåll
- automatisk sammanfattar längre text
- extraherar det viktigaste meningarna

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Namngiven entity recognition

A

Algoritm som analyserar innehåll
- identifierar och klassificerar det som är namngivet
- personer, platser, företag

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Sentimentanalys

A

Algoritm för att analysera innehåll
- Identifierna och klassificiera emotionella tonen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Latent semantisk analys

A

Algoritm för att analysera innehåll
- Identitera underliggande koncept
- Hitta synonymer
- Vikt som representerar frekvens
- Singular value decomposition

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Singular value decomposition

A

Minskar hela tiden samtidigt som man bevarar de viktigaste relationerna.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

IBM Watson

A

Fråga-Svar system
- Djupa analyser och komplexa problem

17
Q

PageRank

A

Rangordnar webbsidor efter deras relevans
- Matematisk formel som uppdateras ju fler länkar som sidan har
- Bayes sats för att räkna ut sannolikheten att sidan klickas på igen

18
Q

HITS

A

liknar PageRank med räknar in innehållet av sidorna

19
Q

SimRank

A

Mäter likhet mellan två webbsidor
- Anta två sidor som refereras av samma sidor vara lika

20
Q

TrustRank

A

Filtrerar ut spam-sidor
- Utifrån hur många pålitliga sidor som länkar