Я пытаюсь создать ASR system
с существующими предварительно обученными моделями, доступными в качестве образца. Я застрял в месте, где можно добавить новые слова в эту обученную модель, чтобы в следующий раз она вернет правильное слово; Какая-то концепция машинного обучения. Любые идеи будут полезны.Как добавить новые слова или словарный запас в платформу kaldi?
0
A
ответ
-1
Есть две вещи, которые вы, возможно, потребуется:
Lexicon: Попробуйте найти что-то вроде
lexicon.txt
в папку данных, добавьте ваши слова и соответствующие телефонные последовательности в нем, как:speech s p iy ch the dh ax the dh iy
Языковая модель: найдите что-то вроде
XXX.lm
в своей папке с данными, добавьте свое слово в 1 грамм с вероятностью, например:\data\ ngram 1=200 ngram 2=4000 ... \1-grams -7.3241 the ...
После этого сделайте декодер HCLG.fst
еще раз на основе этих 2 новых файлов.
Примечание: Числа в языке сделают результаты распознавания речи разные, вам нужно выбрать правильный номер, или использовать инструментарий srilm
для создания его текст вашего корпуса.