2012-03-25 2 views
1

Я пытаюсь создать довольно длинную цепочку программ и библиотек, которая завершается использованием API-интерфейса для преобразования текста в текст для запуска mp3 файл в удобочитаемый текст. Я был удивлен, увидев очень мало API, которые делают это в Интернете - единственной рабочей вещью, которую я нашел, был проект speech2text: https://github.com/taf2/speech2text, который подключается к неофициальному API-интерфейсу Google для текста.flac: «ОШИБКА: входной файл имеет ID3v2-тег» (это не так)

Это на самом деле работало в первую очередь. Я сделал несколько ручных преобразований и был доволен результатами. Однако, пытаясь автоматизировать цепочку процессов на Java, она перестала работать должным образом.

EDIT - следующие сообщения об ошибках являются технически источником из самого flac, а не текста речи2. Попытка конвертировать эти файлы с использованием только flac и not speech2text также приводит к сообщению об ошибке id3v2, поэтому ошибка не связана с речевым текстом (хотя речевой текст может быть источником ошибочных тегов)

Java сообщает об этом как ошибка (после того, как названный speech2text использованием ProcessBuilder и распечатывания потоки):

/Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_inspector.rb:50:in initialize': undefined method first' for nil:NilClass (NoMethodError) from /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_splitter.rb:77:in new' from /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_splitter.rb:77:in initialize' from /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_to_text.rb:15:in new' from /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_to_text.rb:15:in to_text' from /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/bin/speech2text:11 from /usr/bin/speech2text:19:in `load' from /usr/bin/speech2text:19

Однако попытка выполнить команду вручную на тот же файл на самом деле дает мне это:

ERROR: input file ./chunk-abortion-test-audio-0.mp3 has an ID3v2 tag /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_splitter.rb:59:in to_flac': failed to convert chunk: ./chunk-abortion-test-audio-0.mp3 with flac ./chunk-abortion-test-audio-0.mp3 (RuntimeError) from /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_to_text.rb:18:in to_text' from /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_to_text.rb:17:in each' from /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_to_text.rb:17:in to_text' from /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/bin/speech2text:11 from /usr/bin/speech2text:19:in `load' from /usr/bin/speech2text:19

, конечно, Ирония здесь что я действительно очистил файл тегов id3v2, используя id3v2 --delete-all на терминале Mac. Так что что-то шуточное происходит.

Может ли кто-нибудь предположить, что может произойти? Кроме того, учитывая, что речевой текст не видел обновления за год, я чувствую, что должно быть новое решение для преобразования речи в текст, которое люди используют. Так что если есть что-то лучше, пожалуйста, дайте мне знать.

Cheers!

EDIT - Кстати, если кому-то интересен mp3-файл, возникший из удаления файла .flv с помощью ffmpeg.

ответ

0

Это две разные проблемы. Проблема ID3v2, которую я смог решить, обойдя использование файлов .mp3 и вместо этого используя .wav. Выход Java по-прежнему остается проблемой, поэтому я перехожу к новому Вопросу.

 Смежные вопросы

  • Нет связанных вопросов^_^