РУсскоязычный Архив Электронных СТатей периодических изданий
Известия высших учебных заведений. Поволжский регион. Технические науки/2015/№ 4/

АЛГОРИТМ ПОСТРОЕНИЯ СТАТИСТИЧЕСКОГО ДИСКРЕТНО-КОНТИНУАЛЬНОГО ОПИСАНИЯ ДЛИТЕЛЬНОСТИ ЗВУКОВ ПОТОКА ОСМЫСЛЕННОЙ РЕЧИ ДИКТОРА

Актуальность и цели. Основными проблемами при разработке алгоритмов и программ, реализующих аутентификацию по голосу, являются следующие: вариации голоса пользователя (голос способен изменяться в зависимости от состояния здоровья, возраста, настроения и т.д.); наличие шумовой компоненты. Решение этих проблем позволит применять голосовую технологию аутентификации, которая обеспечит наилучшую защиту персональных данных, простоту в применении, и которая является наиболее дешевой среди существующих технологий идентификации личности Материалы и методы. В работе использованы численные и цифровые методы обработки сигналов, спектральные методы, методы математической статистики и временных рядов, а также искусственного интеллекта и распознавания образов. В основу построения фрагментатора положена континуальнодискретная модель обработки речи, которая в сочетании с узкополосным фильтром позволяет определять среднюю длительность звука. Результаты. Показано, что качественный классификатор речи тон/шум должен давать выходные данные «0» и «1», длительность которых описывается континуально-дискретным распределением значений длительности интервалов между участками тональных звуков, распределенных по нормальным законам. Дискретная часть распределения образуется дискретным характером потока появления в речи тональных и шумовых звуков, а также их сочетаний (пар, троек, четверок и т.д.). Непрерывная (континуальная) часть распределения значений длин звуков обусловлена нестабильностью речи при смене темпа произношения. Приведен метод вычисления средней длины одного звука осмысленной речи. Данное исследование позволило построить автомат по определению средней длины звука на различных участках звукового сигнала. Выводы. Предложен численный алгоритм идентификации речи отдельного диктора, позволяющий производить синхронизацию участков речи. Использование разработанного алгоритма позволило уточнять значения параметров, характеризующих статистическое описание длительности интервалов между шумовыми звуками речи и между тональными звуками Проведенное исследование позволило построить автомат по определению средней длины звука на различных участках звукового сигнала. Полученные результаты являются базой для построения нейросетевых технологий аутентификации.

Авторы
Тэги
Тематические рубрики
Предметные рубрики
В этом же номере:
Резюме по документу**
** - вычисляется автоматически, возможны погрешности

Похожие документы: