Index construction. Distributed indices. Dynamic indices. Flashcards

1
Q

Какво е важно да се вземе предвид при изграждането на система за извличане на информация?

A

Хардуерните ограничения

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Какво е времето за преместване на главата при четене или писане от диска?

A

Около 5 ms

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Какво представлява буферът в контекста на оперативната памет?

A

Част от оперативната памет, която държи прочетените или записаните блокове

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Какво е блоково индексиране, базирано на сортиране?

A

Процес на изграждане на индекс чрез обхождане на документи и събиране в паметта двойки термин-docID, докато не се запълни блок, след което този блок се записва в паметта и се сортира

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Какво представлява termID в контекста на блоковото индексиране?

A

Уникален сериен номер, представящ термин

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Какви алгоритми използват уеб търсачките за разпределено индексиране?

A

Document-partitioned index и term-partitioned index

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Какво представлява MapReduce архитектурата?

A

Структура, която разделя изчисленията на малки части, обработвани от множество машини

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Какви са основните фази на MapReduce архитектурата?

A

Map и Reduce

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Какво е динамично индексиране?

A

Процес, който позволява добавянето на нови термини и актуализиране на постинг списъците

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Какви индекси поддържа динамичното индексиране?

A

Голям основен и малък спомагателен

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Какво представлява спомагателният индекс в динамичното индексиране?

A

Малък индекс за новите документи, съхраняван в паметта

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Как се извършват търсения в динамичното индексиране?

A

В търсенията се използват и двата индекса, а резултатите се обединяват

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Какво е блоково индексиране?

A

Процес на събиране на данни в блокове и последващо записване на диска

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Какво е основното предимство на Индексирането в паметта с едно обхождане?

A

Позволява индексиране на колекция от всякакъв размер, стига да има достатъчно дисково пространство

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Какво е необходимото условие за периодично реконструиране на индекса?

A

Малък брой промени и достатъчно ресурси

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Какво се случва, когато спомагателният индекс стане твърде голям?

A

Слива се с основния индекс

17
Q

Какво е основният недостатък на съхраняването на всеки постинг списък като отделен файл?

A

Нееффективност при работа с голям брой файлове

18
Q

Каква стратегия предпочитат някои търсачки за обновление на индекса?

A

Реконструкция от нулата

19
Q

Какво представлява Map фазата?

A

Фаза, при която данните се преобразуват в ключ-стойност двойки

20
Q

Какво представлява Reduce фазата?

A

Фаза, при която всички двойки за даден ключ се обединяват и запазват близо една до друга за бързо извличане.