2016-10-22 7 views
0

Я просмотрел учебник Matlab по адресу Formant Estimation using LPC Coefficients. Хотя я смутно понимаю детали, не совсем понятно, почему мы должны это делать. От http://person2.sol.lu.se/SidneyWood/praate/whatform.html:Понимание формантов из аудиосигнала

форманта является концентрацией акустической энергии вокруг определенной частоты в речевой волне

Почему не достаточно, чтобы принять ДПФ звукового сигнала (после некоторой предварительной обработки если необходимо)? В частотной области пики соответствуют этим концентрациям, правильно?

+1

Для таких вопросов есть http://dsp.stackexchange.com. –

+0

Это полезно, спасибо! – Sean

ответ

0

Немного поздно в игре, но для тех, кто наткнулся на это.

ДПФ или БПФ, показывающие частотную характеристику речевого сигнала, представляют собой гармоники голосового тракта.

Формантный алгоритм, который вы упоминаете Роем Снеллом, использует метод автокорреляции, чтобы найти резонансы голосового тракта, которые представляют форманты. Это в основном сглаженный FFT/DFT, где пики представляют форманты. Есть много переменных, которые могут войти в расчет LPC, который изменит эффект сглаживания.

У Google Scholar есть много исследований в области, а также книг, я бы рекомендовал Acoustic Слуховой фонетики, помог мне понять все это немного лучше, и это не сложно прочитать!

 Смежные вопросы

  • Нет связанных вопросов^_^