2015-04-10 6 views
1

Я редактировал код диалога, чтобы он работал для моего проекта.Sphinx4: Как улучшить точность распознавания wav-файла в демо-диалоге

  1. Я создал текстовый файл с некоторыми из возможных предложений, которые будут использоваться в моей работе. Я добавил ссылку в разделе комментариев.
  2. Я выполнил шаги на http://cmusphinx.sourceforge.net/wiki/tutoriallm, чтобы создать свою модель языка с помощью веб-службы.
  3. тогда, я редактировал диалоговый код будет:

    package dialog; 
    
    import edu.cmu.sphinx.api.Configuration; 
    import edu.cmu.sphinx.api.SpeechResult; 
    import edu.cmu.sphinx.api.StreamSpeechRecognizer; 
    import java.io.File; 
    import java.io.FileInputStream; 
    import java.io.InputStream; 
    
    public class EmployeeCode { 
    
    private static final String ACOUSTIC_MODEL = "resource:/edu/cmu/sphinx/models/en-us/en-us"; 
    private static final String DICTIONARY_PATH = "models/language/TAR0779/0779.dic"; 
    private static final String LANGUAGE_MODEL = "models/language/TAR0779/0779.lm"; 
    
    
    public static void main(String[] args) throws Exception { 
    
        System.out.println("Loading models..."); 
    
        Configuration configuration = new Configuration(); 
        configuration.setAcousticModelPath(ACOUSTIC_MODEL); 
        configuration.setDictionaryPath(DICTIONARY_PATH); 
        configuration.setLanguageModelPath(LANGUAGE_MODEL); 
    
        StreamSpeechRecognizer lmRecognizer = new StreamSpeechRecognizer(configuration); 
    
        InputStream stream = new FileInputStream(new File("/Users/ha/NetBeansProjects/Dialog/WAV/sample1.wav")); 
    
        lmRecognizer.startRecognition(stream); 
        SpeechResult result;  
    
        while ((result = lmRecognizer.getResult()) != null) 
        { 
         System.out.println("You said: " + result.getHypothesis() + '\n'); 
        } /* else 
        { 
         System.out.println("There is no stream."); 
        } */ 
    
        lmRecognizer.stopRecognition(); 
    
    } 
    

    }

  4. после запуска вывода является:

    пробег: Загрузка моделей ... 16 апреля 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: * + NSN + 16 апреля 2015 г. 2:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: * + SPN + 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: AA 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица измерения: AE 16 апреля 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица измерения: AH 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: AO 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic. UnitManager getUnit INFO: CI Единица: AW 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: AY 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: B 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic .UnitManager getUnit INFO: CI Единица: CH 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: D 16 апреля 2015 г. 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: DH 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: EH 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: ER 16 апр 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Раздел: EY 16 апреля 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Раздел: F 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: G 16 апреля 2015 г. 2:04:10 edu.cmu.sphinx.linguist.acoustic. UnitManager getUnit INFO: CI Единица: HH 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: IH 16 апр 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: IY 16 апреля 2015 г. 2:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager get Unit INFO: CI Единица: JH 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: K 16 апреля 2015 г. 2:04:10 edu .cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: L 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: M 16 апреля 2015 г. 2: 16:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: N 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: NG 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица измерения: OW 16 апреля 2015 г. 2:04:10 edu.cmu.sphinx. linguist.acoustic.UnitManager getUnit INFO: CI Единица: OY 16 апреля 2015 г. 2:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: P 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: R 16 апреля 2015 г. 2:04:10 edu. cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица измерения: S 16 апреля 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Раздел: SH 16 апреля , 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: T 16 апреля 2015 г. 2:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: TH 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: UH 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: UW 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic .UnitManager getUnit INFO: CI Единица: V 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: W 16 апреля 2015 г. 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: Y 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: Z 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: ZH 16 апреля 2015 г. 2:04:11 edu.c mu.sphinx.frontend.AutoCepstrum initDataProcessors INFO: компонент Cepstrum автоматически настроен следующим образом: autoCepstrum {MelFrequencyFilterBank, Denoise, DiscreteCosineTransform2, Lifter} 16 апреля 2015 г. 2:04:11 edu.cmu.sphinx.linguist.dictionary. TextDictionary allocate INFO: Загрузка словаря из: файла: модели/языка/TAR0779/0779.dic 16 апреля 2015 г. 2:04:12 edu.cmu.sphinx.linguist.dictionary.TextDictionary выделить INFO: Загрузка словаря наполнителя из : jar: file: /Users/ha/Downloads/sphinx4-data-1.0-20150223.210601-7-sources.jar!/edu/cmu/sphinx/models/en-us/en-us/noisedict 16 апр 2015 2 : 04: 12 PM edu.cmu.sphinx.linguist.acoustic.tiedstate.Sphinx3Loader logInfo INFO: Загрузка акустической модели с фиксированным состоянием из: jar: file: /Users/ha/Downloads/sphinx4-data-1.0-20150223.210601- 7-sources.jar!/Edu/cmu/sphinx/models/en-us/en-us 16 апреля 2015 г. 2:04:12 edu.cmu.sphinx.linguist.acoustic.tiedstate.Pool logInfo INFO: Пул означает Записи: 16128 16 апреля 2015 г. 14:04:12 edu.cmu.sphinx.linguist.acoustic.tiedstate.Pool logInfo INFO: Пул дисперсии Записи: 16128 16 апреля 2015 г. 14:04:12 edu .cmu.sphinx.linguist.acoustic.tiedstate.Pool logInfo INFO: Pool transition_matrices Записи: 42 16 апреля 2015 г. 14:04:12 edu.cmu.sphinx.linguist.acoustic.tiedstate.Pool logInfo INFO: Pool senones Записи: 5126 16 апреля 2015 г. 14:04:12 edu.cmu.sphinx.linguist.acoustic.tiedstate.GaussianWeights logInfo INFO: гауссовские веса: mix_weights.Записи: 15378 16 апреля 2015 г. 2:04:12 edu.cmu.sphinx.linguist.acoustic.tiedstate.Pool logInfo INFO: Pool senones Записи: 5126 16 апреля 2015 г. 2:04:12 edu.cmu .sphinx.linguist.acoustic.tiedstate.Sphinx3Loader logInfo INFO: Context Independent Unit Записи: 42 16 апреля 2015 г. 2:04:12 edu.cmu.sphinx.linguist.acoustic.tiedstate.HMMManager logInfo INFO: Менеджер HMM : 137095 hmms 16 апреля 2015 г. 2:04:12 edu.cmu.sphinx.linguist.acoustic.tiedstate.TiedStateAcousticModel logInfo INFO: CompositeSenoneSequences: 0 16 апреля 2015 г. 2:04:13 edu.cmu.sphinx .linguist.acoustic.HMMPool dumpInfo INFO: Max CI Units 43 16 апреля 2015 г. 2:04:13 edu.cmu.sphinx.ling uist.acoustic.HMMPool dumpInfo INFO: Размер стола блока 79507 16 апреля 2015 г. 14:04:13 edu.cmu.sphinx.util.TimerPool showTimesShortTitle INFO: # ------------ ----------------- Таймеры -------------------------------- -------- 16 апреля 2015 г. 14:04:13 edu.cmu.sphinx.util.TimerPool showTimesShortTitle INFO: # Name Count CurTime MinTime MaxTime AvgTime TotTime
    16 апр 2015 2:04: 13 PM edu.cmu.sphinx.util.Timer showTimesShort INFO: Загрузить AM 1 3.0410s 3.0410s 3.0410s 3.0410s 3.0410s
    16 апреля 2015 г. 2:04:13 edu.cmu.sphinx.util.Timer showTimesShort INFO: Загрузить словарь 1 0.0520s 0.0520s 0.0520s 0.0520s 0.0520s
    16 апреля 2015 г. 14:04:13 edu.cmu.sphinx.util.Timer showTimesShort ИНФОРМАЦИЯ: Компиляция 1 1.8290s 1.8290s 1.8290s 1.8290s 1.8290s
    16 апреля 2015 г. 2:04:17 edu. cmu.sphinx.instrumentation.SpeedTracker showAudioUsage INFO: На этот раз Аудио: 0.95s Proc: 3.15s Скорость: 3.32 X в реальном времени 16 апреля 2015 г. 2:04:17 edu.cmu.sphinx.instrumentation.SpeedTracker showAudioSummary INFO : Total Time Audio: 0.95s Proc: 3.15s 3.32 X в реальном времени 16 апреля 2015 г. 14:04:17 edu.cmu.sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Mem Total: 212.50 Mb Бесплатно: 70.12 Mb Apr 16, 2015 2:04:17 PM edu.cmu.sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Используется: Это: 142.38 Mb Среднее: 142,38 Мб Макс: 142,38 Mb Вы сказали: ЧТО

    16 апреля 2015 2:04:20 PM edu.cmu.sphinx.instrumentation.SpeedTracker showAudioUsage INFO: Это Аудио Время: 0.96s Proc: 2,45 s Скорость: 2.55 X в реальном времени 16 апреля 2015 г. 14:04:20 edu.cmu.sphinx.instrumentation.SpeedTracker showAudioSummary INFO: Total Time Аудио: 1.91s Proc: 5.60s 2.93 X в реальном времени Apr 16, 2015 2:04:20 PM edu.cmu.sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Mem Total: 237.00 Mb Бесплатно: 141.00 Mb Apr 16, 2015 2:04:20 PM edu.cmu.sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Используется: Это: 96,00 Mb Среднее: 119,19 Mb Макс: 142,38 Mb Вы сказали: МНОГИЕ ЛЮДИ

    16 апреля 2015 2:04:21 PM edu.cmu.sphinx.instrumentation.SpeedTracker showAudioUsage INFO: На этот раз Аудио: 1429182208.00s Proc: 1.19s Скорость: 0,00 X в реальное время 16 апреля 2015 г. 14:04:21 edu.cmu.sphinx.instrumentation.SpeedTracker showAudioSummary INFO: Total Time Аудио: 1429182208.00s Proc: 6.79s 0.00 X в реальном времени 16 апреля 2015 г. 2:04:21 edu. cmu.sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Mem Всего: 247.50 Mb Бесплатно: 144,35 Mb 16 апреля 2015 2:04:21 PM edu.cmu.sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Используется: Это: 103,15 Mb Среднее значение: 113.84 Мб Макс.38 Mb Вы сказали: МНОГО

    16 апреля 2015 2:04:21 PM edu.cmu.sphinx.util.TimerPool showTimesShortTitle INFO: # --------------- -------------- Таймеры ----------------------------------- ----- 16 апреля 2015 г. 14:04:21 edu.cmu.sphinx.util.TimerPool showTimesShortTitle INFO: # Name Count CurTime MinTime MaxTime AvgTime TotTime
    16 апр 2015 2:04:21 edu .cmu.sphinx.util.Timer showTimesShort INFO: Нагрузка AM 1 3.0410s 3.0410s 3.0410s 3.0410s 3.0410s
    16 апреля 2015 2:04:21 PM edu.cmu.sphinx.util.Timer showTimesShort INFO: Загрузить словарь 1 0.0520s 0.0520s 0.0520s 0.0520s 0.0520s
    16 апреля 2015 2:04:21 PM edu.cmu.sphinx.util.Timer showTimesShort INFO: Score 586 0.0000s 0.0000s 0.2270s 0.0031s 1.8140s
    16 апр 2015 2:04:21 PM edu.cmu.sphinx.util.Timer showTimesShort INFO: Чернослив 2043 0.0000s 0.0000s 0.0020s 0.0000s 0.0280s
    16 апреля 2015 2:04:21 PM edu.cmu.sphinx.util.Timer showTimesShort INFO : Grow 2051 0.0000s 0.0000s 0.9200s 0.0025s 5.1330s
    16 апреля 2015 г. 2:04:21 edu.cmu.sphinx.util.Timer showTimesShort INFO: Frontend 298 0.0000s 0.0000s 0.2100s 0,0009s 0.2640s
    16 апреля 2015 г. 2:04:21 edu.cmu.sphinx.util.Timer showTi mesShort INFO: Компиляция 1 1.8290s 1.8290s 1.8290s 1.8290s 1.8290s
    16 апреля 2015 2:04:21 PM edu.cmu.sphinx.instrumentation.SpeedTracker showAudioSummary INFO: Общее время Аудио: 1429182208.00s Proc: 6,79 s 0.00 X в реальном времени 16 апреля 2015 г. 2:04:21 edu.cmu.sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Mem Total: 247.50 Mb Бесплатно: 141.87 Mb 16 апреля 2015 г. 2:04:21 edu .cmu.sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Используется: Это: 105,63 Мб Среднее: 111,79 Мб Макс: 142,38 Mb BUILD УСПЕШНОГО (общее время: 28 секунд)

Правильный результат: Какова минимальная зарплата.

мой файл WAV является: https://www.mediafire.com/?khgyc9bhltz0z3b

Как я могу улучшить точность моего файла WAV?

Заранее спасибо

+0

вот мой корпус: https://www.mediafire.com/?boil55ly65551k6 – user3246661

+0

вот мой новый корпус: https://www.mediafire.com/?boil55ly65551k6 – user3246661

+0

Вам нужно удалить знаки пунктуации из корпуса перед тренировкой lm. –

ответ

1

частного статический окончательная Строка ACOUSTIC_MODEL = "модель/акустический/WSJ";

Это неправильно, вам нужно использовать по умолчанию ан-Смоделируем

Я удалил много строк отсутствует фонетическую транскрипцию слова в моем корпусе

мозолистого должен быть текстовым файлом, а не RTF-файлом. Вам нужно попытаться снова создать языковую модель и словарь.

+0

Спасибо за ваш ответ @ Николай-Шмырев. Я редактировал код в своем вопросе, и результат тоже изменился. не могли бы вы мне помочь? – user3246661

+0

Я понятия не имею, что вы там испортили, я предлагаю вам начать с чистой демонстрации снова и внести свои изменения. –

+0

Спасибо @ николай-шмырев. Ошибка, возникшая после того, как я добавила модель en-us в качестве акустической модели. также я изменил путь словаря. когда я, но они вернусь как: private static final String ACOUSTIC_MODEL = "models/acoustic/wsj"; private static final String DICTIONARY_PATH = "models/acoustic/wsj/dict/cmudict.0.6d"; private static final String LANGUAGE_MODEL = "модели /language/TAR7772/7772.lm "; Код работает с самой точностью закона. Любая помощь, пожалуйста? – user3246661

 Смежные вопросы

  • Нет связанных вопросов^_^