РУсскоязычный Архив Электронных СТатей периодических изданий
Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии/2015/№ 2/

МЕТОД СЕМАНТИЧЕСКОЙ КЛАСТЕРИЗАЦИИ ГИПЕРТЕКСТОВОЙ СТРУКТУРЫ С ПРИМЕНЕНИЕМ СТАТИСТИКИ ПЕРЕХОДОВ ПОЛЬЗОВАТЕЛЕЙ ПО ВНУТРЕННИМ ССЫЛКАМ

Кластеризация веб-документов по различным признакам, включая их семантическую близость, лежит в основе различных современных подходов к поиску и извлечению информации в Интернете. В данной статье предложен метод построения семантических кластеров в гипертекстовой структуре веб-сайта на основе статистики переходов пользователей между узлами. Кластеризация документов по отслеживаемым маршрутам пользователей применяется к графовой модели гипертекстовой структуры веб-сайта Приводятся результаты апробации предложенного подхода на реальных веб-сайтах.

Авторы
Тэги
Тематические рубрики
Предметные рубрики
В этом же номере:
Резюме по документу**
** - вычисляется автоматически, возможны погрешности

Похожие документы: