Я использую API Microsoft Speech для распознавания речи и нашел это довольно простым. Кроме того, транскрибированный/распознанный текст, мне нужно захватить сегмент аудио, который соответствует тексту, например. если пользователь скажет «Я делаю», мне нужно сохранить аудиозапись - есть ли стандартный способ сделать это?Разделение речи и речи речи Microsoft Speech
0
A
ответ
-1
Найдено что-то в их примере API - Проверим ..