Я хочу добавить временные метки для бронирования предложений, подгоняя соответствующую аудиокнигу. На разных языках идеально.Создать временные метки для субтитров в audibook
Вот пример:
Гордость и предубеждение
text from gutenberg project
audio from Librivox
Моя идея состояла в том, чтобы найти инструмент распознавания голоса, который ставит временные метки на предложениях (шаг 1), а затем на карте беспорядочную транскрипцию в исходный текст с использованием расстояний levenshtein (шаг 2).
На сайте https://speechlogger.appspot.com/ предлагается решение для 1-го шага, но оно ограничено в выдаче символов. Я мог теоретически использовать веб-автоматизацию, чтобы выполнить работу, начиная каждую новую запись каждую минуту или около того, но это действительно грязно.
Я выполнил шаг 2 в R и протестировал его на образце, который я получил из речевого устройства, и он работает нормально, но это может быть значительно улучшено, если программа знает текст, например, когда вы читаете, чтобы подготовить программное обеспечение для распознавания речи. Я не использую всю мою информацию здесь, сначала переписывая.
Итак, мои вопросы касаются того, какие альтернативные способы могут быть использованы для создания временных файлов аудио, и есть ли способ сделать мой процесс более умным, позволяя механизму распознавания узнать, что он должен распознавать?
Moody Mudskipper, интересно, можете ли вы предоставить мне приложение для Android, посмотрите [этот пост] (http://cs.stackexchange.com/q/52769/45942), чтобы посмотреть, что я ищу. Какие-либо предложения? Большое большое спасибо. –
То, что вы пытаетесь создать, - это то, что я назвал «Audio-eBooks», которые содержат текст и аудио, в синхронизации. Посмотрите на https://www.readbeyond.it/, где вы также можете найти aeneas, принудительный выравниватель, который хорошо работает для такого приложения, на 30 языках. –
Это выглядит потрясающе Альберто, спасибо огромное –