2015-12-15 13 views
0

То, что я пытаюсь сделать, это «разделить» гласные от согласных от аудиофайла (wav-файл). Например, файл будет следующим предложением: «Я в порядке», и мне приходится отделять гласные звуки от согласных. После «разделения» я могу игнорировать согласные, потому что они не имеют значения в этом проекте. Кроме того, я должен игнорировать паузы в речи (паузы между словами). Итак, это моя проблема, как отделить гласные от согласных.Сегментация аудио

Мне сообщили, что для сегментации я мог бы использовать алгоритм fcm или метод гистограммы. Я искал эти 2 метода, однако я не мог найти то, что могло мне помочь.

Может ли кто-нибудь пройти меня через шаги, которые мне нужно сделать или дать мне полезные ссылки? Я хочу упомянуть, что я также могу использовать некоторые другие методы (не обязательно fcm или гистограммы).

Спасибо!

ответ

1

Вы можете использовать методы сегментации на основе марковской модели (HMM) для сегментации вашего речевого сигнала в соответствующие фонемы. Для этого вам нужна правильная транскрипция речевого сигнала и буквенно-звуковых правил (LTS). После того, как вы правильно отредактируете речь, вы можете легко отделить гласные. Эта ссылка будет полезна в этом http://hts.sp.nitech.ac.jp/