Как создать словарь (.dict) для нашего конкретного языка. Я использую набор инструментов CMU для создания модели языка ARPA, но в этом нет возможности создать файл .dict. Заранее спасибо.Как создать файл словаря из словаря?
0
A
ответ
1
Существует короткий tutorial page, который объясняет несколько способов создания словаря для Sphinx.
В общем, для английского языка есть existing dictionary, который охватывает довольно много слов. Если он не содержит каких-либо ваших конкретных слов домена, произношения должны быть сгенерированы системой grapheme-to-phoneme (G2P), указанной в первой ссылке. G2P учится из существующего словаря и генерирует произношения для новых.
Следует учитывать только акустическую модель. Если вы используете некоторые из уже подготовленных моделей Sphinx, вы должны убедиться, что произношения сгенерированы с той же самой фонемой, что и учебный словарь.
Спасибо @agorin – sumit