Инструмент преобразования речи в текст Kdenlive. Это мой опыт

Инструмент преобразования речи в текст

На прошлой неделе Pablinux рассказал вам о новой версии Kdenlive, инструмента для редактирования видео из проекта KDE. Как я однажды заметил, я предпочитаю OpenShot, у которого более низкая кривая обучения, ноПоскольку меня очень заинтересовал инструмент преобразования речи в текст, включенный в эту новую версию, я решил взглянуть на него.

Хотя я написал свою долю статей об альтернативах Linux той или иной программе для Windows (никто не может называть себя Linux-блоггером, если он не написал ни одной из этих программ), этот подход мне не нравится. Я считаю, что о программах следует говорить по их особенностям. Если мне нужно как-то дать определение Kdenlive, я скажу, что это видеоредактор для любителей, которые хотят, чтобы их творения выглядели профессионально.

Я говорил в прошлом и держу это (приходите по одному), что бесплатное программное обеспечение с открытым исходным кодом имеет библиотеки для работы с мультимедиа, благодаря которым продукты Adobe и Blackmagic выглядят как простые игрушки. Большая проблема в том, что никого не интересовало объединение этих инструментов с простым и привлекательным интерфейсом и полной и легкой для понимания документацией. Хотя Kdenlive далек от достижения своей цели, его разработчики находятся на правильном пути.

В случае возможности преобразования речи в текст Kdenlive использует два инструмента из арсенала репозитория Индекс пакетов Python.

Vosk - это набор инструментов для распознавания речи с открытым исходным кодом и офлайн.п. Он предлагает модели распознавания речи для 17 языков и диалектов: английский, индийский английский, немецкий, французский, испанский, португальский, китайский, русский, турецкий, вьетнамский, итальянский, голландский, каталонский, арабский, греческий, фарси и филиппинский.

Kdenlive использует модели Vosk через модуль, написанный на Python.

Однако иметь стенограмму недостаточно. Вы также должны синхронизировать его с видео. Для этого нам понадобится еще один модуль на Python для создания субтитров.

Kdenlive проверит, установлены ли у вас эти модули. пДля этого вам нужно сначала установить пакет python3-pip в вашем дистрибутиве, а затем выполнить команды:

pip3 install vosk

pip3 install srt

Далее нам нужно установить голосовые модели. Для этого мы открываем Kdenlive и собираемся Настройки Настроить Kdenlive Speech to Text.

Чтобы загрузить модели, у вас есть два варианта: или загрузить модели из эту страницу и загрузить их вручную (Вы должны сначала установить флажок Пользовательские папки модема) или вставить ссылку из списка, который показывает вам ту же страницу.

Использование инструмента преобразования речи в текст

  1. Убедитесь, что в меню «Просмотр» активирована опция субтитров. Затем загрузите видео, которое хотите расшифровать.
  2. Переместите видео на первую видеодорожку и проведите синей линией по длине, которую вы хотите расшифровать.
  3. Щелкните вкладку субтитров, а затем знак +
  4. Подсказка добавлена ​​вверху. Щелкните значок слева от глаза.
  5. Выберите модель транскрипции и, если вы хотите транскрибировать клип, все клипы на шкале времени или часть шкалы времени. Нажмите на Процесс

Я сравнил Speech с технологией и бесплатной версией облачного инструмента и видел видео с субтитрами на Youtube и платных платформах курсов. Должен сказать, что он не идеален, но не хуже упомянутых альтернатив. У него проблемы, когда говорящие не владеют хорошей дикцией или делают это из-за музыки или другого звука. Но, представив вопрос, который они мне задают, да, его можно использовать для субтитров к сериалу или фильму. Хотя из-за указанных ограничений их, возможно, придется заполнять вручную.

И, если бы ребята из Kdenlive немного вставили батарейки и интегрировали модуль перевода, все было бы идеально.

Есть кое-что, что можно улучшить. Сегодня, если вы хотите изменить внешний вид субтитров, вам нужно будет вставить код. И нет возможности их экспортировать. Вы сможете увидеть их только встроенными в видео.

Но, как я уже сказал выше, без сомнения, проект идет в правильном направлении.


Содержание статьи соответствует нашим принципам редакционная этика. Чтобы сообщить об ошибке, нажмите здесь.

Комментарий, оставьте свой

Оставьте свой комментарий

Ваш электронный адрес не будет опубликован. Обязательные для заполнения поля помечены *

*

*

  1. Ответственный за данные: AB Internet Networks 2008 SL
  2. Назначение данных: контроль спама, управление комментариями.
  3. Легитимация: ваше согласие
  4. Передача данных: данные не будут переданы третьим лицам, кроме как по закону.
  5. Хранение данных: база данных, размещенная в Occentus Networks (ЕС)
  6. Права: в любое время вы можете ограничить, восстановить и удалить свою информацию.

  1.   Габриэль де Лука сказал

    В поле редактирования справа вверху вы можете выделить весь текст, скопировать его в буфер обмена, а затем вставить куда хотите.