Я редактировал код диалога, чтобы он работал для моего проекта.Sphinx4: Как улучшить точность распознавания wav-файла в демо-диалоге
- Я создал текстовый файл с некоторыми из возможных предложений, которые будут использоваться в моей работе. Я добавил ссылку в разделе комментариев.
- Я выполнил шаги на http://cmusphinx.sourceforge.net/wiki/tutoriallm, чтобы создать свою модель языка с помощью веб-службы.
тогда, я редактировал диалоговый код будет:
package dialog; import edu.cmu.sphinx.api.Configuration; import edu.cmu.sphinx.api.SpeechResult; import edu.cmu.sphinx.api.StreamSpeechRecognizer; import java.io.File; import java.io.FileInputStream; import java.io.InputStream; public class EmployeeCode { private static final String ACOUSTIC_MODEL = "resource:/edu/cmu/sphinx/models/en-us/en-us"; private static final String DICTIONARY_PATH = "models/language/TAR0779/0779.dic"; private static final String LANGUAGE_MODEL = "models/language/TAR0779/0779.lm"; public static void main(String[] args) throws Exception { System.out.println("Loading models..."); Configuration configuration = new Configuration(); configuration.setAcousticModelPath(ACOUSTIC_MODEL); configuration.setDictionaryPath(DICTIONARY_PATH); configuration.setLanguageModelPath(LANGUAGE_MODEL); StreamSpeechRecognizer lmRecognizer = new StreamSpeechRecognizer(configuration); InputStream stream = new FileInputStream(new File("/Users/ha/NetBeansProjects/Dialog/WAV/sample1.wav")); lmRecognizer.startRecognition(stream); SpeechResult result; while ((result = lmRecognizer.getResult()) != null) { System.out.println("You said: " + result.getHypothesis() + '\n'); } /* else { System.out.println("There is no stream."); } */ lmRecognizer.stopRecognition(); }
}
после запуска вывода является:
пробег: Загрузка моделей ... 16 апреля 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: * + NSN + 16 апреля 2015 г. 2:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: * + SPN + 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: AA 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица измерения: AE 16 апреля 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица измерения: AH 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: AO 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic. UnitManager getUnit INFO: CI Единица: AW 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: AY 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: B 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic .UnitManager getUnit INFO: CI Единица: CH 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: D 16 апреля 2015 г. 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: DH 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: EH 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: ER 16 апр 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Раздел: EY 16 апреля 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Раздел: F 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: G 16 апреля 2015 г. 2:04:10 edu.cmu.sphinx.linguist.acoustic. UnitManager getUnit INFO: CI Единица: HH 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: IH 16 апр 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: IY 16 апреля 2015 г. 2:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager get Unit INFO: CI Единица: JH 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: K 16 апреля 2015 г. 2:04:10 edu .cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: L 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: M 16 апреля 2015 г. 2: 16:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: N 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: NG 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица измерения: OW 16 апреля 2015 г. 2:04:10 edu.cmu.sphinx. linguist.acoustic.UnitManager getUnit INFO: CI Единица: OY 16 апреля 2015 г. 2:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: P 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: R 16 апреля 2015 г. 2:04:10 edu. cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица измерения: S 16 апреля 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Раздел: SH 16 апреля , 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: T 16 апреля 2015 г. 2:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: TH 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: UH 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: UW 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic .UnitManager getUnit INFO: CI Единица: V 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: W 16 апреля 2015 г. 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: Y 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: Z 16 апреля 2015 г. 14:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: ZH 16 апреля 2015 г. 2:04:11 edu.c mu.sphinx.frontend.AutoCepstrum initDataProcessors INFO: компонент Cepstrum автоматически настроен следующим образом: autoCepstrum {MelFrequencyFilterBank, Denoise, DiscreteCosineTransform2, Lifter} 16 апреля 2015 г. 2:04:11 edu.cmu.sphinx.linguist.dictionary. TextDictionary allocate INFO: Загрузка словаря из: файла: модели/языка/TAR0779/0779.dic 16 апреля 2015 г. 2:04:12 edu.cmu.sphinx.linguist.dictionary.TextDictionary выделить INFO: Загрузка словаря наполнителя из : jar: file: /Users/ha/Downloads/sphinx4-data-1.0-20150223.210601-7-sources.jar!/edu/cmu/sphinx/models/en-us/en-us/noisedict 16 апр 2015 2 : 04: 12 PM edu.cmu.sphinx.linguist.acoustic.tiedstate.Sphinx3Loader logInfo INFO: Загрузка акустической модели с фиксированным состоянием из: jar: file: /Users/ha/Downloads/sphinx4-data-1.0-20150223.210601- 7-sources.jar!/Edu/cmu/sphinx/models/en-us/en-us 16 апреля 2015 г. 2:04:12 edu.cmu.sphinx.linguist.acoustic.tiedstate.Pool logInfo INFO: Пул означает Записи: 16128 16 апреля 2015 г. 14:04:12 edu.cmu.sphinx.linguist.acoustic.tiedstate.Pool logInfo INFO: Пул дисперсии Записи: 16128 16 апреля 2015 г. 14:04:12 edu .cmu.sphinx.linguist.acoustic.tiedstate.Pool logInfo INFO: Pool transition_matrices Записи: 42 16 апреля 2015 г. 14:04:12 edu.cmu.sphinx.linguist.acoustic.tiedstate.Pool logInfo INFO: Pool senones Записи: 5126 16 апреля 2015 г. 14:04:12 edu.cmu.sphinx.linguist.acoustic.tiedstate.GaussianWeights logInfo INFO: гауссовские веса: mix_weights.Записи: 15378 16 апреля 2015 г. 2:04:12 edu.cmu.sphinx.linguist.acoustic.tiedstate.Pool logInfo INFO: Pool senones Записи: 5126 16 апреля 2015 г. 2:04:12 edu.cmu .sphinx.linguist.acoustic.tiedstate.Sphinx3Loader logInfo INFO: Context Independent Unit Записи: 42 16 апреля 2015 г. 2:04:12 edu.cmu.sphinx.linguist.acoustic.tiedstate.HMMManager logInfo INFO: Менеджер HMM : 137095 hmms 16 апреля 2015 г. 2:04:12 edu.cmu.sphinx.linguist.acoustic.tiedstate.TiedStateAcousticModel logInfo INFO: CompositeSenoneSequences: 0 16 апреля 2015 г. 2:04:13 edu.cmu.sphinx .linguist.acoustic.HMMPool dumpInfo INFO: Max CI Units 43 16 апреля 2015 г. 2:04:13 edu.cmu.sphinx.ling uist.acoustic.HMMPool dumpInfo INFO: Размер стола блока 79507 16 апреля 2015 г. 14:04:13 edu.cmu.sphinx.util.TimerPool showTimesShortTitle INFO: # ------------ ----------------- Таймеры -------------------------------- -------- 16 апреля 2015 г. 14:04:13 edu.cmu.sphinx.util.TimerPool showTimesShortTitle INFO: # Name Count CurTime MinTime MaxTime AvgTime TotTime
16 апр 2015 2:04: 13 PM edu.cmu.sphinx.util.Timer showTimesShort INFO: Загрузить AM 1 3.0410s 3.0410s 3.0410s 3.0410s 3.0410s
16 апреля 2015 г. 2:04:13 edu.cmu.sphinx.util.Timer showTimesShort INFO: Загрузить словарь 1 0.0520s 0.0520s 0.0520s 0.0520s 0.0520s
16 апреля 2015 г. 14:04:13 edu.cmu.sphinx.util.Timer showTimesShort ИНФОРМАЦИЯ: Компиляция 1 1.8290s 1.8290s 1.8290s 1.8290s 1.8290s
16 апреля 2015 г. 2:04:17 edu. cmu.sphinx.instrumentation.SpeedTracker showAudioUsage INFO: На этот раз Аудио: 0.95s Proc: 3.15s Скорость: 3.32 X в реальном времени 16 апреля 2015 г. 2:04:17 edu.cmu.sphinx.instrumentation.SpeedTracker showAudioSummary INFO : Total Time Audio: 0.95s Proc: 3.15s 3.32 X в реальном времени 16 апреля 2015 г. 14:04:17 edu.cmu.sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Mem Total: 212.50 Mb Бесплатно: 70.12 Mb Apr 16, 2015 2:04:17 PM edu.cmu.sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Используется: Это: 142.38 Mb Среднее: 142,38 Мб Макс: 142,38 Mb Вы сказали: ЧТО16 апреля 2015 2:04:20 PM edu.cmu.sphinx.instrumentation.SpeedTracker showAudioUsage INFO: Это Аудио Время: 0.96s Proc: 2,45 s Скорость: 2.55 X в реальном времени 16 апреля 2015 г. 14:04:20 edu.cmu.sphinx.instrumentation.SpeedTracker showAudioSummary INFO: Total Time Аудио: 1.91s Proc: 5.60s 2.93 X в реальном времени Apr 16, 2015 2:04:20 PM edu.cmu.sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Mem Total: 237.00 Mb Бесплатно: 141.00 Mb Apr 16, 2015 2:04:20 PM edu.cmu.sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Используется: Это: 96,00 Mb Среднее: 119,19 Mb Макс: 142,38 Mb Вы сказали: МНОГИЕ ЛЮДИ
16 апреля 2015 2:04:21 PM edu.cmu.sphinx.instrumentation.SpeedTracker showAudioUsage INFO: На этот раз Аудио: 1429182208.00s Proc: 1.19s Скорость: 0,00 X в реальное время 16 апреля 2015 г. 14:04:21 edu.cmu.sphinx.instrumentation.SpeedTracker showAudioSummary INFO: Total Time Аудио: 1429182208.00s Proc: 6.79s 0.00 X в реальном времени 16 апреля 2015 г. 2:04:21 edu. cmu.sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Mem Всего: 247.50 Mb Бесплатно: 144,35 Mb 16 апреля 2015 2:04:21 PM edu.cmu.sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Используется: Это: 103,15 Mb Среднее значение: 113.84 Мб Макс.38 Mb Вы сказали: МНОГО
16 апреля 2015 2:04:21 PM edu.cmu.sphinx.util.TimerPool showTimesShortTitle INFO: # --------------- -------------- Таймеры ----------------------------------- ----- 16 апреля 2015 г. 14:04:21 edu.cmu.sphinx.util.TimerPool showTimesShortTitle INFO: # Name Count CurTime MinTime MaxTime AvgTime TotTime
16 апр 2015 2:04:21 edu .cmu.sphinx.util.Timer showTimesShort INFO: Нагрузка AM 1 3.0410s 3.0410s 3.0410s 3.0410s 3.0410s
16 апреля 2015 2:04:21 PM edu.cmu.sphinx.util.Timer showTimesShort INFO: Загрузить словарь 1 0.0520s 0.0520s 0.0520s 0.0520s 0.0520s
16 апреля 2015 2:04:21 PM edu.cmu.sphinx.util.Timer showTimesShort INFO: Score 586 0.0000s 0.0000s 0.2270s 0.0031s 1.8140s
16 апр 2015 2:04:21 PM edu.cmu.sphinx.util.Timer showTimesShort INFO: Чернослив 2043 0.0000s 0.0000s 0.0020s 0.0000s 0.0280s
16 апреля 2015 2:04:21 PM edu.cmu.sphinx.util.Timer showTimesShort INFO : Grow 2051 0.0000s 0.0000s 0.9200s 0.0025s 5.1330s
16 апреля 2015 г. 2:04:21 edu.cmu.sphinx.util.Timer showTimesShort INFO: Frontend 298 0.0000s 0.0000s 0.2100s 0,0009s 0.2640s
16 апреля 2015 г. 2:04:21 edu.cmu.sphinx.util.Timer showTi mesShort INFO: Компиляция 1 1.8290s 1.8290s 1.8290s 1.8290s 1.8290s
16 апреля 2015 2:04:21 PM edu.cmu.sphinx.instrumentation.SpeedTracker showAudioSummary INFO: Общее время Аудио: 1429182208.00s Proc: 6,79 s 0.00 X в реальном времени 16 апреля 2015 г. 2:04:21 edu.cmu.sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Mem Total: 247.50 Mb Бесплатно: 141.87 Mb 16 апреля 2015 г. 2:04:21 edu .cmu.sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Используется: Это: 105,63 Мб Среднее: 111,79 Мб Макс: 142,38 Mb BUILD УСПЕШНОГО (общее время: 28 секунд)
Правильный результат: Какова минимальная зарплата.
мой файл WAV является: https://www.mediafire.com/?khgyc9bhltz0z3b
Как я могу улучшить точность моего файла WAV?
Заранее спасибо
вот мой корпус: https://www.mediafire.com/?boil55ly65551k6 – user3246661
вот мой новый корпус: https://www.mediafire.com/?boil55ly65551k6 – user3246661
Вам нужно удалить знаки пунктуации из корпуса перед тренировкой lm. –