К вопросу о векторизации графических спектрограмм
Для повышения точности оценки параметров математических моделей речевого сигнала предлагается использовать методы контурного анализа изображений применительно к графическим спектрограммам. Использование векторизации обеспечивает возможность выделения индивидуальных признаков речи на основе статистического анализа характеристик контуров на спектрограмме. Каждый из выделенных контуров является незамкнутой линией, содержащей информацию об изменении мгновенной частоты и амплитуды компонента речевого сигнала (речевого вокализма). При этом учитываются следующие особенности речевого сигнала: средняя скорость изменения частоты основного тона, минимальное расстояние между отдельными гармониками, взаимная корреляция уровня сигнала для соседних следов фонообъектов. В настоящей работе рассмотрен подход к формированию массива данных, описывающего графическую спектрограмму речевого сигнала в векторном формате. Показано, что представление графической спектрограммы как массива отдельных контуров дает новые возможности в области анализа, синтеза, обработки и классификации речевых сигналов.
Авторы
Тэги
Тематические рубрики
Предметные рубрики
В этом же номере:
Резюме по документу**
К вопросу о векторизации графических спектрограмм
УДК 004.934
К вопросу о векторизации графических спектрограмм
А.М. Бонч-Бруевич, С.Б. Козлачков
МГТУ им. <...> Н.Э. Баумана, Москва, 105005, Россия
Для повышения точности оценки параметров математических моделей речевого
сигнала предлагается использовать методы контурного анализа изображений
применительно к графическим спектрограммам. <...> Использование векторизации
обеспечивает возможность выделения индивидуальных признаков речи на основе
статистического анализа характеристик контуров на спектрограмме. <...> Каждый
из выделенных контуров является незамкнутой линией, содержащей информацию
об изменении мгновенной частоты и амплитуды компонента речевого сигнала
(речевого вокализма). <...> При этом учитываются следующие особенности речевого
сигнала: средняя скорость изменения частоты основного тона, минимальное расстояние
между отдельными гармониками, взаимная корреляция уровня сигнала для
соседних следов фонообъектов. <...> В настоящей работе рассмотрен подход к формированию
массива данных, описывающего графическую спектрограмму речевого
сигнала в векторном формате. <...> Показано, что представление графической спектрограммы
как массива отдельных контуров дает новые возможности в области
анализа, синтеза, обработки и классификации речевых сигналов. <...> При оценке защищенности речевой информации, обработке акустических
сигналов или идентификации диктора по голосу необходимо
выделить информационные признаки в речевом сигнале. <...> Как
правило, для выделения используются следующие признаки: частотные
(спектр, частота основного тона, спектральная плотность мощности);
временные (огибающая, частота переходов через ноль); частотно-временные
(графическая спектрограмма в виде полутонового
изображения). <...> Существующие
математические модели речевого сигнала основаны на
описании речевого тракта человека дифференциальными уравнениями,
на совокупности мгновенных, экстремальных <...>
** - вычисляется автоматически, возможны погрешности
Похожие документы: