Я использую IBM Watson speech-to-text
API
. В речи разные частоты разных людей. Уотсон способен обнаруживать разные частоты людей?Есть ли способ повысить эффективность IBM Watson для преобразования речи в текст для понимания разных частот?
0
A
ответ
0
Речевой Текстовые службы только выпустили динамик этикетки функция, которая может решить, что вы заинтересованы в:
http://www.ibm.com/watson/developercloud/doc/speech-to-text/output.shtml#speaker_labels
Пожалуйста, обратите внимание, чтобы увидеть, обеспечивает ли эта новая функция, что вам нужно.
Спасибо!