2014-01-14 2 views
0

Я могу извлечь функции из аудиофайлов, хранящихся в системе, с помощью OpenSMILE. Но мне нужно извлекать функции в режиме реального времени, используя тот же OpenSMILE. Возможно ли, без сохранения записанного аудиофайла?Извлечение аудио-функций из ввода в реальном времени с использованием OpenSMILE

ответ

1

Кажется, он может его поддерживать. Из manual

Чтобы проверить, если ваш SMILExtract двоичная поддерживает живую аудиозапись и воспроизведения, тип: SMILExtract -H cPortaudio

и

Компоненты cPortaudioSource и cPortaudioSink могут быть использованы в качестве замены для cWaveSource и cWaveSink. Они производят/ожидают данные в том же формате, что и компоненты волны.

Hooray для интернет-поиска ...

0

Он работает должным образом, если вы строите openSMILE с Portaudio :)

Согласно инструкции:

... Живой пример извлечения функция при условии, что захватывает живое аудио и извлекает просодические функции (контуры тона и громкости) со входа. Функции сохраняются в CSV-файле. Для того, чтобы использовать эту conguration, введите:

SMILExtract -C конфиг/liveProsodyAcf.conf

1

Вам также может потребоваться компонент cTurnDetector (см SIG'MM учебник, на который ссылается на http://opensmile.audeering.com/) и VAD, чтобы включить сегментации ваш живой ввод для некоторых функций (функционалов).

Также проверьте: How to create custom config files in OpenSMILE, чтобы узнать, как вы можете настроить конфигурационные файлы и правильно настроить размеры буфера (в режиме реального времени важно использовать кольцевые буферы, чтобы избежать увеличения потребления памяти).