РУсскоязычный Архив Электронных СТатей периодических изданий
Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии/2010/№ 2/

МЕТОД АВТОМАТИЧЕСКОГО ПОСТРОЕНИЯ СЕМАНТИЧЕСКИХ ОТНОШЕНИЙ МЕЖДУ КОНЦЕПТАМИ ИНФОРМАЦИОННО-ПОИСКОВОГО ТЕЗАУРУСА

Качественно составленный информационно-поисковый тезаурус – ценный источник семантической информации, применяемый в различных технических приложениях, в особенности, в области информационного поиска. Основное препятствие для широкого применения подобных семантических ресурсов заключаются в высокой трудоемкости и стоимости их ручного составления. В данной работе представлен метод автоматического построения семантических отношений между концептами информационно-поискового тезауруса. Предлагаемый метод основан на дистрибутивно-статистическом анализе синтаксических контекстов и позволяет получить векторное представление как отдельных слов так и словосочетаний. Предлагается способ оценки качества автоматически извлеченных семантических отношений, основанный на использовании тезауруса составленного вручную профессиональными лексикографами. Результаты экспериментов показывают что метод способен обнаружить пары концептов связанные коротким путем в тезаурусе составленном вручную. С другой стороны, восстановление точной структуры оригинального тезауруса только с помощью предложенного метода представляется затруднительным.

Авторы
Тэги
Тематические рубрики
Предметные рубрики
В этом же номере:
Резюме по документу**
** - вычисляется автоматически, возможны погрешности

Похожие документы: