АЛГОРИТМЫ ПОИСКА, ИСПОЛЬЗУЕМЫЕ В LUCENE.NET

В статье рассмотрены модели поиска, положенные в основу работы Lucene.Net, и описаны особенности ранжирования документов. Одной из важнейших становится задача поиска по содержимому за конечное время в большом объеме документов. Традиционные системы поиска, как правило, ориентируются на работу со структурированными текстовыми данными и мало приспособлены для обработки мультимедийной и неструктурированной информации. Тогда возникает проблема поиска и выборки необходимой информации из большого неструктурированного массива. Одним из факторов, стимулирующих развитие технологий поиска, является появление огромного количества электронных библиотек, содержащих значительные объемы актуальных знаний. В связи с тем, что выбор алгоритма поиска зависит от особенностей проекта, необходима разработка более совершенных методов, берущих за основу приведенные модели и обеспечивающих высокую релевантность найденных документов по исковому запросу пользователя за возможно более короткие сроки, а также обладающие точно вычисляемым сроком выдачи результата. Требуются особые виды поиска и обработки результата, а также особое количество или формат данных в проекте. В данной статье выделены параметры, которые следует учитывать при выборе поискового механизма. Проанализированы существующие подходы к решению задач поиска и предложено их улучшение, основанное на использовании модификации булевого поиска (метод взвешенного зонного ранжирования). Приведены критерии оценки информационного поиска. Показана концептуальная формула для оценки релевантности поиска Lucene.Net.

Авторы

Жердева М.В.

Тэги

информационный поиск документ критерии релевантность поисковые системы

Тематические рубрики

Предметные рубрики

В этом же номере:

ФОРМИРОВАНИЕ НАВЫКОВ ОПРЕДЕЛЕНИЯ ЯРУСНОСТИ ДРЕВОСТОЕВ В ПЕРИОД ЛЕТНЕЙ ПРАКТИКИ СТУДЕНТОВ ПО ДИСЦИПЛИНЕ «ТАКСАЦИЯ ЛЕСА», ОБ ИНТЕГРАЛЕ ЛЕБЕГА-СТИЛТЬЕСА С РАЗРЫВНОЙ ПРОИЗВОДЯЩЕЙ ФУНКЦИЕЙ И ЕГО СВЯЗИ С ИНТЕГРАЛОМ РИМАНА-СТИЛТЬЕСА, ...

Резюме по документу**

** - вычисляется автоматически, возможны погрешности

Похожие документы:

Похожие документы из РУАЭСТ
|
Похожие документы из Руконт

АЛГОРИТМЫ ПОИСКА, ИСПОЛЬЗУЕМЫЕ В LUCENE.NET

Помощь:

Участники: