2016-09-27 11 views
0

Если я посылаю этот маленький кусочек SSML к речевому процессору я получаю два голосаСмешение языков в том же SSML

<speak version='1.0' xml:lang='es-ES'> 
    <voice xml:lang='es-ES' xml:gender='Male' name='Microsoft Server Speech Text to Speech Voice (es-ES, Pablo, Apollo)'> 
    <p> 
     <s>Hola </s> 
     <s xml:lang='en'>Hello</s> 
     <s>¿Cómo estas?.</s> 
    </p> 
    </voice> 
</speak> 

Человек в испанском и женщина на английском языке. Является ли это ограничением механизма Project Oxford Text to Speech? другими словами, я ожидал бы, что тот же голос будет говорить на нескольких языках, но похоже, что это не так.

ответ

0

Цитирую SSML spec,

Определение XML: языки не означает изменения голоса, хотя это действительно может произойти. Когда данный голос не может говорить на указанном языке, для процессора может быть выбран новый голос.

В то время как текущее поведение при отказе оставляет желать лучшего, рекомендуется создать несколько голосовых узлов и более четко выбрать голос при переключении языков.