У меня есть рабочее приложение, которое использует интерфейс речи Bluemix для текста, чтобы предоставить закрытые титры для источников потоковой передачи Http Live Streaming. Однако есть некоторая задержка с разбором звука из файлов ts. Мой код выглядит следующим образом:bluemix речь в реальном времени с текстом с HLS
videoProps.stream = WatsonSpeechToText.recognizeElement({
element: myMediaElement,
token: videoProps.ctx.token,
muteSource: false,
autoPlay: false,
model:videoProps.ctx.currentModel,
timestamps: true,
profanity_filter: true,
inactivity_timeout: -1,
continuous: true
})
.pipe(new WatsonSpeechToText.FormatStream());
videoProps.stream.on("result", function(result) {
//do something
}
Есть ли более быстрый API для использования, который приближает меня к реальному времени?
Благодаря
Здравствуйте Аарону, Какую модель вы используете? Английский Широкополосная модель? Скорость зависит от качества записи. Какой коэффициент реального времени вы получаете (RTF = время декодирования/время звучания). Какой аудиоформат? Пожалуйста, попробуйте подать файл через нашу демоверсию. Когда я говорю с ним, я всегда получаю быстрее, чем распознавание в реальном времени. Dani –