Поиск морфологических шаблонов для устойчивых словосочетаний произвольной длины
Проведено исследование, результатом которого является перечень морфологических шаблонов устойчивых многословных словосочетаний русского языка. Автор планирует использовать результаты данной работы в методе автоматического извлечения устойчивых словосочетаний произвольной длины.
Авторы
Тэги
Тематические рубрики
Предметные рубрики
В этом же номере:
Резюме по документу**
Аспирант и соискатель, 6, 2010
Табарча А.И., аспирант СанктПетербургского
государственного
университета
информационных технологий,
механики и оптики
ПОИСК МОРФОЛОГИЧЕСКИХ ШАБЛОНОВ ДЛЯ УСТОЙЧИВЫХ
СЛОВОСОЧЕТАНИЙ ПРОИЗВОЛЬНОЙ ДЛИНЫ
Введение
Задача автоматического выделения устойчивых словосочетаний из текста возникает при
решении многих прикладных задач автоматической обработки текстов, таких как индексирование
и рубрикация документов, создание терминологических словарей и тезаурусов [1]. <...> Существует
множество методов и подходов автоматического извлечения устойчивых словосочетаний
из текста. <...> Наиболее универсальными считаются статистические методы ввиду использования
минимума лингвистических ресурсов, они же являются и наименее точными [2]. <...> Для повышения точности используются различные модификации с привлечением лингвистических
знаний. <...> Из рассмотренных методов автоматического извлечения устойчивых словосочетаний,
основывающихся на статистике встречаемости и минимальных лингвистических данных,
наилучшие результаты показывают методы, применяющие в дополнение к статистике встречаемости,
морфологические шаблоны. <...> Правда, такие исследования проводились лишь для
двухсловных словосочетаний [3]. <...> В рассмотренных работах по извлечению устойчивых словосочетаний произвольной
длины[4] не использовались морфологические шаблоны. <...> И, как отметили сами исследователи,
применение морфологических шаблонов могло бы повысить точность. <...> Постановка задачи
В данной работе предлагается провести анализ устойчивых словосочетаний произвольной
длины, с целью выявления морфологических шаблонов для них. <...> В качестве источника
данных предлагается использование словосочетаний из заголовков статей словарей и энциклопедий. <...> Для достижения цели предлагается провести морфологический анализ словосочетаний
и собрать статистику наиболее употребительных морфологических шаблонов. <...> Основная часть
Как уже <...>
** - вычисляется автоматически, возможны погрешности
Похожие документы: