Моделирование речевых признаков с помощью алгоритма симуляции отжига

Мел-частотные кепстральные коэффициенты до сих пор являются наиболее популярными речевыми признаками. Однако в зависимости от длины речевого тракта (стоит отметить, что длина речевого тракта зависит от пола и других физиологических параметров, таких как рост, и может меняться в пределах от 13 до 18 см) частоты центральных формант оказываются смещёнными. Величина смещения может достигать 25%. Такие большие различия могут вести к неправильному распознаванию высказывания предварительно хорошо обученной модели в случае, если высказывание было произнесено новым диктором, то есть система становится дикторозависимой. Альтернативой является применение признаков, которые не зависят от диктора, например, полученные с помощью аудиовизуальных моделей (Auditory Image Model).

Авторы

Ермилов А.В.

Тэги

речевые признаки алгоритм симуляции отжига распознавание речи моделирование распределений численные методы.

Тематические рубрики

Прикладные науки. Медицина. Технология

Предметные рубрики

В этом же номере:

Получение амплитуды ионизации из решения временного уравнения Шрёдингера с помощью потока вероятности сквозь поверхность, Улучшение локальности параллельных алгоритмов численного решения двумерных квазилинейных параболических уравнений, ...

Резюме по документу**

** - вычисляется автоматически, возможны погрешности

Похожие документы:

Похожие документы из РУАЭСТ
|
Похожие документы из Руконт

Моделирование речевых признаков с помощью алгоритма симуляции отжига

Помощь:

Участники: