Я могу извлечь функции из аудиофайлов, хранящихся в системе, с помощью OpenSMILE. Но мне нужно извлекать функции в режиме реального времени, используя тот же OpenSMILE. Возможно ли, без сохранения записанного аудиофайла?Извлечение аудио-функций из ввода в реальном времени с использованием OpenSMILE
ответ
Кажется, он может его поддерживать. Из manual
Чтобы проверить, если ваш SMILExtract двоичная поддерживает живую аудиозапись и воспроизведения, тип:
SMILExtract -H cPortaudio
и
Компоненты cPortaudioSource и cPortaudioSink могут быть использованы в качестве замены для cWaveSource и cWaveSink. Они производят/ожидают данные в том же формате, что и компоненты волны.
Hooray для интернет-поиска ...
Он работает должным образом, если вы строите openSMILE с Portaudio :)
Согласно инструкции:
... Живой пример извлечения функция при условии, что захватывает живое аудио и извлекает просодические функции (контуры тона и громкости) со входа. Функции сохраняются в CSV-файле. Для того, чтобы использовать эту conguration, введите:
SMILExtract -C конфиг/liveProsodyAcf.conf
Вам также может потребоваться компонент cTurnDetector (см SIG'MM учебник, на который ссылается на http://opensmile.audeering.com/) и VAD, чтобы включить сегментации ваш живой ввод для некоторых функций (функционалов).
Также проверьте: How to create custom config files in OpenSMILE, чтобы узнать, как вы можете настроить конфигурационные файлы и правильно настроить размеры буфера (в режиме реального времени важно использовать кольцевые буферы, чтобы избежать увеличения потребления памяти).