О НЕКОТОРЫХ СПОСОБАХ ОПРЕ ДЕЛЕНИ Я СЛОВОСОЧЕТ АНИЙ ДЛЯ ЗАДАЧИ КЛ АССИФИК АЦИИ Т ЕКСТ ОВ
В работе исследуются различные способы определения понятия "словосочетание". Помимо метода, использующего го-граммы, рассматриваются новые способы, основанные на синтаксических деревьях. Вводятся понятия "n-цепи", "n-поддеревья", "полные t-поддеревья". Новые типы словосочетаний могут служить основой для признаков текстов в задачах машинного обучения. Все описанные типы словосочетаний сравниваются между собой в задаче определения авторства, поставленной как задача классификации.
Авторы
Тэги
Тематические рубрики
Предметные рубрики
В этом же номере:
Резюме по документу**
В работе исследуются различные способы определения понятия "словосочетание". <...> Помимо метода, использующего го-граммы, рассматриваются новые способы, основанные на синтаксических деревьях. <...> Новые типы словосочетаний могут служить основой для признаков текстов в задачах машинного обучения. <...> Все описанные типы словосочетаний сравниваются между собой в задаче определения авторства, поставленной как задача классификации. <...> В работе исследуются различные способы определения понятия "словосочетание". <...> Помимо метода, использующего го-граммы, рассматриваются новые способы, основанные на синтаксических деревьях. <...> Новые типы словосочетаний могут служить основой для признаков текстов в задачах машинного обучения. <...> Все описанные типы словосочетаний сравниваются между собой в задаче определения авторства, поставленной как задача классификации. <...>
** - вычисляется автоматически, возможны погрешности
Похожие документы: