РУсскоязычный Архив Электронных СТатей периодических изданий
Вестник Воронежского государственного университета. Серия: Лингвистика и межкультурная коммуникация/2015/№ 3/

АЛГОРИТМ ОТБОРА ТЕМАТИЧЕСКИ СХОЖИХ ДОКУМЕНТОВ С ПОСТРОЕНИЕМ КОНТЕКСТНО-СЕМАНТИЧЕСКОГО ГРАФА НА ОСНОВЕ ВЕРОЯТНОСТНО-ЭНТРОПИЙНОГО ПОДХОДА

в работе предложен алгоритм поиска тематически схожих документов на основе эталон ной коллекции текстов с возможностью наглядной визуализации результатов поиска в виде контекстно семантического графа вложенных тем. Алгоритм основан на интеграции множества вероятностно энтропийных индикаторов для выделения набора ключевых слов и словосочетаний, описывающего тему для поиска. Результаты тестирования продемонстрировали среднюю точность отбора документов 99 % при полноте 84 % на основе выборки, предоставленной экспертами. Также предложен подход к постро ению графа на базе алгоритма извлечения ключевых словосочетаний с весами, что позволяет отобразить структуру вложенных тем в больших коллекциях документов в компактном виде

Авторы
Тэги
Тематические рубрики
Предметные рубрики
В этом же номере:
Резюме по документу**
** - вычисляется автоматически, возможны погрешности

Похожие документы: