2016-06-03 8 views
0

Я пытаюсь создать ASR system с существующими предварительно обученными моделями, доступными в качестве образца. Я застрял в месте, где можно добавить новые слова в эту обученную модель, чтобы в следующий раз она вернет правильное слово; Какая-то концепция машинного обучения. Любые идеи будут полезны.Как добавить новые слова или словарный запас в платформу kaldi?

ответ

-1

Есть две вещи, которые вы, возможно, потребуется:

  1. Lexicon: Попробуйте найти что-то вроде lexicon.txt в папку данных, добавьте ваши слова и соответствующие телефонные последовательности в нем, как:

    speech s p iy ch 
    the dh ax 
    the dh iy 
    
  2. Языковая модель: найдите что-то вроде XXX.lm в своей папке с данными, добавьте свое слово в 1 грамм с вероятностью, например:

    \data\ 
    ngram 1=200 
    ngram 2=4000 
    ... 
    
    \1-grams 
    -7.3241 the 
    ... 
    

После этого сделайте декодер HCLG.fst еще раз на основе этих 2 новых файлов.

Примечание: Числа в языке сделают результаты распознавания речи разные, вам нужно выбрать правильный номер, или использовать инструментарий srilm для создания его текст вашего корпуса.