Evaluation of Information Retrieval Systems. Measures. Evaluation on corpora of texts. Flashcards

1
Q

Какво е необходимо за измерване на ефективността на системите за извличане на информация?

A

Тестов набор, който се състои от:
* Набор от документи
* Тестов набор от информационни нужди, изразени чрез заявки
* Множество от преценки за уместност

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
1
Q

Какво означава терминът ‘златен стандарт’ или ‘основна истина’ в контекста на оценка на уместността?

A

Подход, при който документът е или уместен, или неуместен за информационната нужда

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
1
Q

Какви мерки се използват за оценяване на ефективността на дадена система?

A

Прецизност (precision) и връщане (recall)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
1
Q

Какво представлява прецизността (P) в извличането на информация?

A

Частта от извлечените документи, които са уместни: P(уместни|извлечени)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
1
Q

Какво представлява връщането (R) в извличането на информация?

A

Частта от уместните документи, които са извлечени: R(извлечени|уместни)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
1
Q

В кои четири категории се класифицират документите?

A
  • Вярно извлчени (true positive)
  • Невярно извлчени (false positive)
  • Невярно неизвлечени (false negative)
  • Вярно неизвлечени (true negatvie)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
1
Q

Какво е точността (accuracy)?

A

Точността измерва частта от правилните класификации

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
1
Q

Защо точността не е подходяща мярка за извличането на информация?

A

Поради силната аисметрия на данните, при която голяма част от документите са неуместни

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
1
Q

Какво е F-мярката?

A

Претегленото хармонично средно на прецизността и връщането

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
1
Q

Какво измерва R-точността?

A

Точността спрямо размера на набора от уместни документи

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Какво е NDCG моделът?

A

Модел, подходящ за ситуации, при които няма двоичност на връзките. Изчислява нормализиращ фактор за класиране на документи

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Какви критерии се използват за измерване на потребителската удовлетвореност?

A
  • Скорост на индексиране
  • Скорост на търсене
  • Експресивност на езика за запитвания
  • Размер на списъка с документи
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Какво представляват потребителските случаи (use cases) в контекста на оценка на удовлетвореността?

A

Ситуации, в които хората изпълняват задачи, а техните действия и резултати се анализират

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Какъв е недостатък от използване на потребителски случаи за оценка на удовлетвореност?

A
  • Отнема много време
  • Скъпа операция е
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Какво е A/B тестване?

A

Метод, при който малка част от трафика се препраща на случаен принцип към новата система с промяна само на един параметър

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Защо A/B се предпочита?

A

Лесно е да се разбере и може да измери малки промени.

8
Q

Какви са двата вида резюмета на документи?

A
  • Статични
  • Динамични
9
Q

Какво са статичните резюмета?

A

Едни и същи за всяка заявка.

10
Q

Какво са динамичните резюмета?

A

Пригодени за конкретната заявка

11
Q

Какъв е недостатъка на динамичните резюмета?

A

По-сложен дизайн и изчисления

12
Q

Кога един документ е уместен?

A

Когато отговаря на изразената информационна нужда, а не защото съдържа съвпадащи думи