На прошлой неделе Pablinux рассказал вам о новой версии Kdenlive, инструмента для редактирования видео из проекта KDE. Как я однажды заметил, я предпочитаю OpenShot, у которого более низкая кривая обучения, ноПоскольку меня очень заинтересовал инструмент преобразования речи в текст, включенный в эту новую версию, я решил взглянуть на него.
Хотя я написал свою долю статей об альтернативах Linux той или иной программе для Windows (никто не может называть себя Linux-блоггером, если он не написал ни одной из этих программ), этот подход мне не нравится. Я считаю, что о программах следует говорить по их особенностям. Если мне нужно как-то дать определение Kdenlive, я скажу, что это видеоредактор для любителей, которые хотят, чтобы их творения выглядели профессионально.
Я говорил в прошлом и держу это (приходите по одному), что бесплатное программное обеспечение с открытым исходным кодом имеет библиотеки для работы с мультимедиа, благодаря которым продукты Adobe и Blackmagic выглядят как простые игрушки. Большая проблема в том, что никого не интересовало объединение этих инструментов с простым и привлекательным интерфейсом и полной и легкой для понимания документацией. Хотя Kdenlive далек от достижения своей цели, его разработчики находятся на правильном пути.
В случае возможности преобразования речи в текст Kdenlive использует два инструмента из арсенала репозитория Индекс пакетов Python.
Vosk - это набор инструментов для распознавания речи с открытым исходным кодом и офлайн.п. Он предлагает модели распознавания речи для 17 языков и диалектов: английский, индийский английский, немецкий, французский, испанский, португальский, китайский, русский, турецкий, вьетнамский, итальянский, голландский, каталонский, арабский, греческий, фарси и филиппинский.
Kdenlive использует модели Vosk через модуль, написанный на Python.
Однако иметь стенограмму недостаточно. Вы также должны синхронизировать его с видео. Для этого нам понадобится еще один модуль на Python для создания субтитров.
Kdenlive проверит, установлены ли у вас эти модули. пДля этого вам нужно сначала установить пакет python3-pip в вашем дистрибутиве, а затем выполнить команды:
pip3 install vosk
pip3 install srt
Далее нам нужно установить голосовые модели. Для этого мы открываем Kdenlive и собираемся Настройки Настроить Kdenlive Speech to Text.
Чтобы загрузить модели, у вас есть два варианта: или загрузить модели из эту страницу и загрузить их вручную (Вы должны сначала установить флажок Пользовательские папки модема) или вставить ссылку из списка, который показывает вам ту же страницу.
Использование инструмента преобразования речи в текст
- Убедитесь, что в меню «Просмотр» активирована опция субтитров. Затем загрузите видео, которое хотите расшифровать.
- Переместите видео на первую видеодорожку и проведите синей линией по длине, которую вы хотите расшифровать.
- Щелкните вкладку субтитров, а затем знак +
- Подсказка добавлена вверху. Щелкните значок слева от глаза.
- Выберите модель транскрипции и, если вы хотите транскрибировать клип, все клипы на шкале времени или часть шкалы времени. Нажмите на Процесс
Я сравнил Speech с технологией и бесплатной версией облачного инструмента и видел видео с субтитрами на Youtube и платных платформах курсов. Должен сказать, что он не идеален, но не хуже упомянутых альтернатив. У него проблемы, когда говорящие не владеют хорошей дикцией или делают это из-за музыки или другого звука. Но, представив вопрос, который они мне задают, да, его можно использовать для субтитров к сериалу или фильму. Хотя из-за указанных ограничений их, возможно, придется заполнять вручную.
И, если бы ребята из Kdenlive немного вставили батарейки и интегрировали модуль перевода, все было бы идеально.
Есть кое-что, что можно улучшить. Сегодня, если вы хотите изменить внешний вид субтитров, вам нужно будет вставить код. И нет возможности их экспортировать. Вы сможете увидеть их только встроенными в видео.
Но, как я уже сказал выше, без сомнения, проект идет в правильном направлении.
Комментарий, оставьте свой
В поле редактирования справа вверху вы можете выделить весь текст, скопировать его в буфер обмена, а затем вставить куда хотите.