2013-07-07 2 views
1

У меня есть проект о распознавании речи. Хотя я использовал библиотеку «sndfile.h», я застрял в чтении входного звука. У меня есть вопрос: данные, которые были прочитаны функцией sf_readf_float(), являются сигналом во временной области, не так ли? Если нет, то что это? Есть ли какая-либо формула для преобразования ее в сигнал во временной области?Проблемы с функцией «sf_readf_float» библиотеки «sndfile.h»

ответ

0

Да, данные, которые возвращает libsndfile, являются данными во временной области: образцы звука из входного файла. Функция sf_readf_float возвращает образцы в «кадрах», причем один кадр представляет собой набор выборок из каждого канала в данный момент времени. Кроме того, sf_readf_float масштабирует образцы в диапазоне [-1.0, 1.0] - подробнее см. this note.

Посмотрите на sndfile-tools, например код, который читает звуковые файлы, используя файл libsndfile. Пример sndfile-mix-to-mono должен быть хорошей отправной точкой.

+0

спасибо вам очень много: D: D – user2530847