Я искал возможности распознавания голоса в iphone с использованием метода HPS. Но обнаруженные тоны не очень точны. Performous делает приличную работу определения высоты тона.Распознавание пиков в Performous code
Я просмотрел код, но я не полностью понял теорию расчетов. Они используют БПФ и находят пики. Но часть, в которой они используют фазу выхода FFT, заставила меня запутать. Я полагаю, что они используют некоторые эвристики для частот голоса.
Итак, может ли кто-нибудь объяснить алгоритм, используемый в Performous для определения высоты тона?
Для получения дополнительной информации вы можете обратиться к http://www.dspdimension.com/admin/pitch-shifting-using-the-ft/, на котором совершенный код основан на (я думаю). 3-й шаг в вашем ответе является решающим и может повлиять на точность ваших результатов. – Shreesh
Фантастический !!! Вы не представляете, насколько эта статья помогла мне! Я искал эту информацию больше недели. Благодаря!!! –
Мне удалось обернуть анализатор производительности для iOS. Если кому-то интересно, пришлите мне по электронной почте sunfish7 | gmail | c0m –