Для обнаружения речи я играл с этой командой Сокса:сокса эффекта: перезапускаемое молчание
rec voice.wav silence 1 5 30% 1 0:00:02 30%
Он должен начать запись, когда объем входного поднимает около порога на 30% и останавливается через 2 секунды аудио падениях ниже того же порога.
Это работает. Но было бы намного лучше, если бы оно могло «перезапускаться». Я имею в виду: после того, как звук падает ниже порога, и звук снова поднимается, он должен продолжить регистрацию (то есть пользователь все еще говорит).
Он должен останавливаться только тогда, когда он обнаруживает тишину целых 2 секунды. Или вы рекомендуете использовать любой другой инструмент «VOX»?
Документ говорит: «Для периодов ниже периода длительность указывает период молчания, который должен существовать до того, как звук больше не копируется. Указав более высокую продолжительность, тишина, которая требуется, может быть оставлена в звуке. Например, если у вас есть песня с ожидаемой 1 секундой тишины в середине и 2 секунды молчания в конце, для прохода средней тишины можно использовать продолжительность 2 секунды ». поэтому он ДОЛЖЕН работать, как я ожидаю. – Mark