1

Я работаю над проектом, где мне необходимо интегрировать функции речи Pocketsphinx в приложение Android. Фактически, мне нужно интегрировать функции распознавания фонем, предоставляемые Pocketpshinx, которые должны уметь воссоздавать фонемы на французском языке, например. речевой рекурсификатор речи должен иметь возможность распознавать слова (например, «de», «re», «se» и т. д.), согласные (например, «m», «f», «g» и т. д.), двойные согласные (например, kl "," ks "," gr "и т. д.) и гласные (например," a "," o "," e "и т. д.). Прямо сейчас, я включил Pocketsphinx для распознавания фонем, упомянутых выше, но у меня очень плохие результаты. Например, когда я произношу «o», признанный результат иногда следующий: «SIL ff ei au» (даже я вообще не произносил буквы «f» и «e»), или что-то еще появилось в начале это не выражено. Буквы, которые появляются в начале, не всегда одинаковы (иногда я получаю «ll», «uu» и т. Д.). Но иногда буква, которую я произношу, появляется в начале (например, для «а», я получаю «SIL aa SIL»), но это происходит очень редко. Итак, могли бы вы, ребята, помочь и сообщить мне, что может быть проблемой и любыми предложениями для решения этой проблемы? Нужно ли мне создавать языковые модели и словарь только с этими буквами, которые меня интересуют (поскольку число букв фиксировано)? Или, может быть, мне нужно сделать адаптацию акустической модели или обучить акустическую модель?Плохая точность распознавания Pocketsphinx с использованием распознавания фонемы на Android, французский язык

спасибо, что заблаговременно!

Leutrim

ответ

1

В модели найти feat.params и изменить -cmuinit значение по вашему выбору, Кроме того, значение «-kws_threshold» к 1e-40f для устранения ложных тревог.

+0

Можете ли вы немного рассказать о значениях? – Vaiden