2008-09-27 4 views
-1

Для проекта, над которым мы в настоящее время работаем, нам нужна библиотека устных слов на разных языках.Библиотеки аудиокассет (устный текст)

Возможны два варианта: текст-речь или «настоящие» записи носителями языка. Поскольку качество важно для нас, мы думаем о том, чтобы идти по последнему пути.

Чтобы создать прототип нашего приложения, мы ищем библиотеки, содержащие как можно больше слов на разных языках. Чтобы получить представление о качестве нашего подхода, эта библиотека не должна состоять из синтезированной речи.

Знаете ли вы о доступных/доступных библиотеках?

ответ

3

Коллега только что нашел это сообщество библиотеки на основе, что приятно, а небольшие по размеру:

Forvo.com

0

Я только что нашел этот on the Audacity wiki: VoxForge. На своем сайте:

VoxForge был создан для сбора транскрибируемой речи для использования с Free и Open Source Speech Recognition Engines (на Linux, Windows и Mac).

Мы предоставим все представленные аудиофайлы в соответствии с лицензией GPL и затем скомпилируем их в акустические модели для использования с системами распознавания речи с открытым исходным кодом, такими как Sphinx, ISIP, Julius и HTK (примечание: HTK имеет ограничения на распространение).

0

Я предполагаю, что вы не найдете нигде библиотеки, состоящую из отдельных слов. Что бы вы ни находили, вам придется открыть аудио в редакторе (например, Pro Tools или Cool Edit) и разбить его на отдельные слова.

Возможно, вам было бы лучше создать список всех слов, которые вам нужны для каждого языка, а затем найти носителей, чтобы читать их во время записи. Вы можете заставить их читать медленно, так что вам будет легко разбить каждое отдельное слово.

+0

Ну, это то, что мы хотим сделать позже в производственном цикле, но для нашего прототипа это шаг, который мы бы хотели избежать. – Grimtron 2008-09-27 12:38:26