Language Models Flashcards
Какво представляват езиковите модели за извличане на информация?
Езиковите модели за извличане на информация се основават на идеята, че документ отговаря на заявка, ако е достатъчно вероятно езиковият модел на документа да генерира заявката. Това означа документ да съдържа думи от заявката достатъчно често.
Как се построява езиков модел за документ?
От всеки документ се построява вероятностен езиков модел и документите се подреждат според вероятността техният езиков модел да генерира заявка
Какво е униграмен езиков модел?
Униграмен езиков модел е модел, при който вероятностите на поредицата от термове се определят независимо
Какво е биграмен езиков модел?
Биграмен езиков модел е по-сложен модел, при който всеки следващ терм зависи от предишния
Какво е ‘bag of words’ в контекста на униграмен модел?
При униграмния модел, подредбата на думите не е от значение, поради което такива модели често се наричат ‘bag of words’
Какво е ‘нулева вероятност’ в контекста на езиковите модели?
Нулева вероятност е проблем, когато дума от заявката липсва в документа, което прави вероятността за генериране на заявката нула
Какво е ‘изглаждане’ в контекста на езиковите модели?
Изглаждането позволява термове, които не се срещат в документа, да имат ненулева вероятност, базирана на тяхната честота в цялата колекция от документи
Какви са основните недостатъци на езиковия модел?
Основните недостатъци включват нереалистично предположение, че документите и заявките са еднотипни, и трудности при включването на концепции като фрази и булеви оператори
Какви са предимствата на езиковия модел спрямо традиционните подходи?
Езиковият модел е концептуално прост, прецизен и лек за изчисление, и е много ефективен
Как генерират заявки езиковите модели?
Подобно на краен автомат
Кога говорим за езиков модел?
Когато всеки възел има вероятностно разпределение на възможните генерирания на термове
Какво е полиномно разпределение?
n опита като всеки завършва с един от k възможни изхода с вероятности p1,…, pk
Какъв е основният проблем на езиковия модел?
Не може да определи точно това, от което се нуждае потребителя
Кой е основният метод за използване на езикови модели в извличането на информация?
Моделът на вероятността на заявките.