То, что я пытаюсь сделать, это «разделить» гласные от согласных от аудиофайла (wav-файл). Например, файл будет следующим предложением: «Я в порядке», и мне приходится отделять гласные звуки от согласных. После «разделения» я могу игнорировать согласные, потому что они не имеют значения в этом проекте. Кроме того, я должен игнорировать паузы в речи (паузы между словами). Итак, это моя проблема, как отделить гласные от согласных.Сегментация аудио
Мне сообщили, что для сегментации я мог бы использовать алгоритм fcm или метод гистограммы. Я искал эти 2 метода, однако я не мог найти то, что могло мне помочь.
Может ли кто-нибудь пройти меня через шаги, которые мне нужно сделать или дать мне полезные ссылки? Я хочу упомянуть, что я также могу использовать некоторые другие методы (не обязательно fcm или гистограммы).
Спасибо!