2016-06-01 7 views
1

Я использую Jasper на Raspbian. Согласно Jasper docs, наряду с PocketSphinx мы также должны установить CMUCLMTK, MIT Language Modeling Toolkit, m2m-aligner, OpenFST и Phonetisaurus.Почему Джасперу требуется столько зависимостей?

Как только я закончил установку PocketSphinx, но до, установив все эти зависимости, я использовал pocketsphinx_continuous для проверки распознавания голоса. Независимо от точности, он, очевидно, смог зафиксировать мою речь и прошел процесс интерпретации. Я создала свои собственные файлы .lm и .dict с помощью CMU's lmtool и попробовал их бесплатно на pocketsphinx_continuous без проблем.

Мой вопрос: PocketSphinx, похоже, способен выполнять распознавание речи без всех этих зависимостей. Почему Джаспер говорит мне, чтобы установить их? Действительно ли PocketSphinx им нужен? В каких целях они служат?

ответ

2

В этом списке не менее 2 не нужны. CMUCLMTK и MITLM являются инструментами языкового моделирования с одинаковой функциональностью. Даже если вы хотите заменить онлайн lmtool, вам нужен только один из них. То же самое, Фонетизавр требует MITLM и m2m-aligner только для обучения моделей g2p, а не для их использования.

В идеале вы хотите, чтобы MITLM, OpenFST и фонетизавр заменяли онлайн lmtool и добавляли новые слова локально. Вам не нужны CMUCLMTK и m2m-aligner.

В будущем Pocketsphinx сможет работать с новыми словами без Phonetisaurus, поэтому вы сможете отказаться от этой зависимости.

Вы должны пожаловаться на разработчиков Jasper, если они все еще доступны для жалоб.

+0

спасибо. Это делает вещи намного яснее. Установка этих зависимостей далека от тривиальных и очень трудоемких на малине Pi. Я люблю, чтобы уйти без них. –

2

CMUCLMTK, MITLM, m2m-aligner, OpenFST и Phonetisaurus не являются зависимостями PocketSphinx и не требуются от PocketSphinx.

Jasper использует CMUCLMTK для компиляции языковой модели (.lm).

Phonetisaurus зависит от OpenFST Lib.

Jasper использует Phonetisaurus для компиляции словаря (.dict).

Jasper не использует MITLM и m2m-aligner.

MITLM, m2m-aligner (только один раз) и OpenFST, необходимые для компиляции модели G2P (FST) из корпуса.

+0

Последнее утверждение не совсем корректно. m2m-aligner когда-то требовался для обучения модели g2p, теперь phonetisaurus включает в себя собственный выравниватель. –

+0

@NikolayShmyrev Вы правы. Документ Jasper очень старый и нуждается в обновлении. Btw lastest Jasper Code (ветка jasper-dev) поддерживает предварительно скомпилированную модель G2P вместе с PocketSphinx-5prealpha. https://sourceforge.net/projects/cmusphinx/files/G2P%20Models/en_us_nostress.tar.gz Следовательно, нет необходимости устанавливать MITLM и m2m-aligner для Jasper. – G10DRAS

 Смежные вопросы

  • Нет связанных вопросов^_^