Vector-spatial model Flashcards

1
Q

Какво е векторно-пространствен модел?

A

Представянето на документи като вектор в общо векторно пространство

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Какво представлява вектор на документ в контекста на векторно-пространствения модел?

A

Вектор с по един компонент за всеки термин от речника

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Какво е косинусова мярка за подобие?

A

Изчисление на приликата между два документа по техните векторни представяния

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Как се представя търсенето в контекста на векторно-пространствения модел?

A

Като вектор

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Какво включва процесът на изчисляване на векторни оценки?

A

Колекция от документи, търсене в свободен текст, положително число K. Процесът включва изчисляване на оценки за документите и избиране на K с най-високи оценки

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Какво представляват шампионските списъци?

A

Предварително определени множества от документи за всеки термин с най-висока тежест

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Какви са два основни етапа при извличането на най-близките K документа?

A
  • Избиране на подмножество A от документи, което съдържа документи с високи резултати
  • Връщане на K документа с най-висок резултат от това А
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Какво са слоести индекси?

A

Обобщение на списъка с най-релевантните документи за термин

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Какво е основното предизвикателство при оценяването на релевантни документи?

A

Променящата се база от документи

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Верно или невярно: Булевият модел може напълно да замени векторния модел.

A

Невярно

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Как се избира лидер в процеса на съкращаване на клъстери?

A

Случайно

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Какво представлява оценяваща функция?

A

Функция, която акумулира резултата от фазите на обработка

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Какви методи се използват за справяне с променящата се база от документи?

A

Методи за машинно самообучение

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Какъв е недостатъка на векторната разлика?

A

Два документа с подобно съдържание имат голяма векторна разлика, тъй като единият е по-дълъг от другия.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Как се справяме с влиянието на дължините на векторите?

A

Като приликата между два документа се представи като изчисление на косинусовата мярка за подобие на техните векторни представяния

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Какво изисква извличането на топ K оценки?

A

Структурата от данни heap

17
Q

Как се съкращава изчислението на косинусите?

A
  • Премахват се всички термини с idf по-малък от определен праф
  • Избират се само документи, които съдържат голям брой от търсените думи
18
Q

Какво представлява съкращаване на клъстерите?

A

Предварителна стъпка, при която се събират векторите на документите и се изчислява косинусовия резултат на тези документи, които са в малки клъстери