2014-12-12 4 views
2

Просто выполните некоторые общие исследования. Существуют ли какие-либо инструменты/программы с открытым исходным кодом (или даже заплаченные?), Которые выполняют следующие действия:Инструменты с открытым исходным кодом для распознавания непереведенной речи без словаря

INPUT: звуковой файл какой-либо немеченой речи, может быть, несколько предложений долго (никаких указаний относительно того, что означает фонетические транскрипции аудио)

ВЫВОД: звуковой файл с фонетической транскрипцией (в alphebet МПА) выравнивают и наклеена на аудио

возможно ли это сделать с помощью только фонетического словаря и без слов словаря?

ответ

1

Sphinx имеет все функции телефона, которые будут производить такую ​​гипотезу вывода. Но большинство распознавания речи сильно улучшается за счет использования фонетического словаря и модели языка n-gram. Можно использовать эти вещи при создании гипотезы, а затем преобразовать их в маркированные выровненные фонемы с помощью Sphinx.

Вот пример только для фонетических материалов.

http://cmusphinx.sourceforge.net/wiki/phonemerecognition

Но я был из гее игры речи в течение длительного времени. Я считаю, что большинство людей сейчас занимаются нейронными сетями для таких концепций, и я не знаю никаких открытых нейронных сетей в этом пространстве.

 Смежные вопросы

  • Нет связанных вопросов^_^