Понимание формантов из аудиосигнала

Я просмотрел учебник Matlab по адресу Formant Estimation using LPC Coefficients. Хотя я смутно понимаю детали, не совсем понятно, почему мы должны это делать. От http://person2.sol.lu.se/SidneyWood/praate/whatform.html:Понимание формантов из аудиосигнала

форманта является концентрацией акустической энергии вокруг определенной частоты в речевой волне

Почему не достаточно, чтобы принять ДПФ звукового сигнала (после некоторой предварительной обработки если необходимо)? В частотной области пики соответствуют этим концентрациям, правильно?

источник

2016-10-22 Sean

Для таких вопросов есть http://dsp.stackexchange.com. –

Это полезно, спасибо! – Sean

Немного поздно в игре, но для тех, кто наткнулся на это.

ДПФ или БПФ, показывающие частотную характеристику речевого сигнала, представляют собой гармоники голосового тракта.

Формантный алгоритм, который вы упоминаете Роем Снеллом, использует метод автокорреляции, чтобы найти резонансы голосового тракта, которые представляют форманты. Это в основном сглаженный FFT/DFT, где пики представляют форманты. Есть много переменных, которые могут войти в расчет LPC, который изменит эффект сглаживания.

У Google Scholar есть много исследований в области, а также книг, я бы рекомендовал Acoustic Слуховой фонетики, помог мне понять все это немного лучше, и это не сложно прочитать!

источник

2017-08-17 17:12:06

Понимание формантов из аудиосигнала

ответ

Смежные вопросы