Извлечение аудио-функций из ввода в реальном времени с использованием OpenSMILE

Я могу извлечь функции из аудиофайлов, хранящихся в системе, с помощью OpenSMILE. Но мне нужно извлекать функции в режиме реального времени, используя тот же OpenSMILE. Возможно ли, без сохранения записанного аудиофайла?Извлечение аудио-функций из ввода в реальном времени с использованием OpenSMILE

источник

2014-01-14 user3140427

Кажется, он может его поддерживать. Из manual

Чтобы проверить, если ваш SMILExtract двоичная поддерживает живую аудиозапись и воспроизведения, тип: SMILExtract -H cPortaudio

Компоненты cPortaudioSource и cPortaudioSink могут быть использованы в качестве замены для cWaveSource и cWaveSink. Они производят/ожидают данные в том же формате, что и компоненты волны.

Hooray для интернет-поиска ...

источник

2014-01-14 16:21:35 AShelly

Он работает должным образом, если вы строите openSMILE с Portaudio :)

Согласно инструкции:

... Живой пример извлечения функция при условии, что захватывает живое аудио и извлекает просодические функции (контуры тона и громкости) со входа. Функции сохраняются в CSV-файле. Для того, чтобы использовать эту conguration, введите:

SMILExtract -C конфиг/liveProsodyAcf.conf

источник

2015-07-24 07:14:31

Вам также может потребоваться компонент cTurnDetector (см SIG'MM учебник, на который ссылается на http://opensmile.audeering.com/) и VAD, чтобы включить сегментации ваш живой ввод для некоторых функций (функционалов).

Также проверьте: How to create custom config files in OpenSMILE, чтобы узнать, как вы можете настроить конфигурационные файлы и правильно настроить размеры буфера (в режиме реального времени важно использовать кольцевые буферы, чтобы избежать увеличения потребления памяти).

источник

2017-04-22 09:13:49 Florian

Извлечение аудио-функций из ввода в реальном времени с использованием OpenSMILE

ответ

Смежные вопросы