У меня есть проект о распознавании речи. Хотя я использовал библиотеку «sndfile.h», я застрял в чтении входного звука. У меня есть вопрос: данные, которые были прочитаны функцией sf_readf_float()
, являются сигналом во временной области, не так ли? Если нет, то что это? Есть ли какая-либо формула для преобразования ее в сигнал во временной области?Проблемы с функцией «sf_readf_float» библиотеки «sndfile.h»
1
A
ответ
0
Да, данные, которые возвращает libsndfile, являются данными во временной области: образцы звука из входного файла. Функция sf_readf_float
возвращает образцы в «кадрах», причем один кадр представляет собой набор выборок из каждого канала в данный момент времени. Кроме того, sf_readf_float
масштабирует образцы в диапазоне [-1.0, 1.0] - подробнее см. this note
.
Посмотрите на sndfile-tools, например код, который читает звуковые файлы, используя файл libsndfile. Пример sndfile-mix-to-mono должен быть хорошей отправной точкой.
спасибо вам очень много: D: D – user2530847