РУсскоязычный Архив Электронных СТатей периодических изданий
Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии/2010/№ 2/

LINK GRAPH ANALYSIS FOR ADULT IMAGES CLASSIFICATION

Для защиты пользователей сервиса поиска изображений от нежелательного содержания нужно уметь выделять нежелательные изображения. В данной статье описывается построение такого классификатора на основе анализа связей сайтов и изображений в сети. Эти связи представляются в виде двудольного ненаправленного графа. С каждой вершиной графа ассоциируется два вещественных числа, отражающие уровень нежелательности и уровень допустимости. Для каждой вершины-изображения эти числа инициализируются нулями, а веса вершин-сайтов инициализируются согласно результатам текстовой классификации сайтов. Далее, с помощью итеративного алгоритма эти значения распространяются вдоль ребер графа. Полученные в итоге веса используются для классификации изображений с нежелательным содержанием. Эксперименты на данных русского сегмента сети Интернет показывают, что рассматриваемый алгоритм превосходит «наивный» алгоритм на 17% полноты при том же уровне точности. «Наивным» алгоритмом мы считаем алгоритм определяющий изображение как нежелательное, если на него есть ссылка хотя бы с одного нежелательного сайта

Авторы
Тэги
Тематические рубрики
Предметные рубрики
В этом же номере:
Резюме по документу**
** - вычисляется автоматически, возможны погрешности

Похожие документы: