Создать метки времени для субтитров в аудиокниге [закрыто]

Я хочу добавить метки времени к предложениям книги, подгоняя соответствующую аудиокнигу. На разных языках в идеале.

Вот пример:
Гордость и предубеждение
текст из проекта Гутенберга
аудио из Librivox

Моя идея состояла в том, чтобы найти инструмент распознавания голоса, который ставит временные метки в предложениях (шаг 1), а затем сопоставить грязную транскрипцию с оригинальным текстом, используя расстояния Левенштейна (шаг 2).

Веб-сайтhttps://speechlogger.appspot.com/ предлагает решение 1-го шага, но оно ограничено в выводе символов. Я мог бы теоретически использовать веб-автоматизацию для выполнения работы, начиная новую запись каждую минуту или около того, но это действительно грязно.

Я написал сценарий для шага 2 в R и протестировал его на примере, который я получил от voicelogger, и он работает хорошо, но это может быть значительно улучшено, если программа знает текст, например, когда вы читаете, чтобы обучить программное обеспечение для распознавания речи. Я не использую всю мою информацию здесь, транскрибируя сначала.

Итак, мои вопросы: какие альтернативные способы я могу использовать для отметки времени аудиофайлов, и есть ли способ, которым я могу сделать свой процесс более интеллектуальным, позволяя механизму распознавания знать, что он должен распознавать?

Ответы на вопрос(1)

Ваш ответ на вопрос