Инструмент преобразования речи в текст Kdenlive. Это мой опыт

Инструмент преобразования речи в текст

На прошлой неделе Pablinux рассказал вам о новой версии Kdenlive, инструмента для редактирования видео из проекта KDE. Как я однажды заметил, я предпочитаю OpenShot, у которого более низкая кривая обучения, ноПоскольку меня очень заинтересовал инструмент преобразования речи в текст, включенный в эту новую версию, я решил взглянуть на него.

Хотя я написал свою долю статей об альтернативах Linux той или иной программе для Windows (никто не может называть себя Linux-блоггером, если он не написал ни одной из этих программ), этот подход мне не нравится. Я считаю, что о программах следует говорить по их особенностям. Если мне нужно как-то дать определение Kdenlive, я скажу, что это видеоредактор для любителей, которые хотят, чтобы их творения выглядели профессионально.

Я говорил в прошлом и держу это (приходите по одному), что бесплатное программное обеспечение с открытым исходным кодом имеет библиотеки для работы с мультимедиа, благодаря которым продукты Adobe и Blackmagic выглядят как простые игрушки. Большая проблема в том, что никого не интересовало объединение этих инструментов с простым и привлекательным интерфейсом и полной и легкой для понимания документацией. Хотя Kdenlive далек от достижения своей цели, его разработчики находятся на правильном пути.

В случае возможности преобразования речи в текст Kdenlive использует два инструмента из арсенала репозитория Индекс пакетов Python.

Vosk - это набор инструментов для распознавания речи с открытым исходным кодом и офлайн.п. Он предлагает модели распознавания речи для 17 языков и диалектов: английский, индийский английский, немецкий, французский, испанский, португальский, китайский, русский, турецкий, вьетнамский, итальянский, голландский, каталонский, арабский, греческий, фарси и филиппинский.

Kdenlive использует модели Vosk через модуль, написанный на Python.

Однако иметь стенограмму недостаточно. Вы также должны синхронизировать его с видео. Для этого нам понадобится еще один модуль на Python для создания субтитров.

Kdenlive проверит, установлены ли у вас эти модули. пДля этого вам нужно сначала установить пакет python3-pip в вашем дистрибутиве, а затем выполнить команды:

pip3 install vosk

pip3 install srt

Далее нам нужно установить голосовые модели. Для этого мы открываем Kdenlive и собираемся Настройки Настроить Kdenlive Speech to Text.

Чтобы загрузить модели, у вас есть два варианта: или загрузить модели из эту страницу и загрузить их вручную (Вы должны сначала установить флажок Пользовательские папки модема) или вставить ссылку из списка, который показывает вам ту же страницу.

Использование инструмента преобразования речи в текст

  1. Убедитесь, что в меню «Просмотр» активирована опция субтитров. Затем загрузите видео, которое хотите расшифровать.
  2. Переместите видео на первую видеодорожку и проведите синей линией по длине, которую вы хотите расшифровать.
  3. Щелкните вкладку субтитров, а затем знак +
  4. Подсказка добавлена ​​вверху. Щелкните значок слева от глаза.
  5. Выберите модель транскрипции и, если вы хотите транскрибировать клип, все клипы на шкале времени или часть шкалы времени. Нажмите на Процесс

Я сравнил Speech с технологией и бесплатной версией облачного инструмента и видел видео с субтитрами на Youtube и платных платформах курсов. Должен сказать, что он не идеален, но не хуже упомянутых альтернатив. У него проблемы, когда говорящие не владеют хорошей дикцией или делают это из-за музыки или другого звука. Но, представив вопрос, который они мне задают, да, его можно использовать для субтитров к сериалу или фильму. Хотя из-за указанных ограничений их, возможно, придется заполнять вручную.

И, если бы ребята из Kdenlive немного вставили батарейки и интегрировали модуль перевода, все было бы идеально.

Есть кое-что, что можно улучшить. Сегодня, если вы хотите изменить внешний вид субтитров, вам нужно будет вставить код. И нет возможности их экспортировать. Вы сможете увидеть их только встроенными в видео.

Но, как я уже сказал выше, без сомнения, проект идет в правильном направлении.


Оставьте свой комментарий

Ваш электронный адрес не будет опубликован. Обязательные для заполнения поля помечены *

*

*

  1. Ответственный за данные: AB Internet Networks 2008 SL
  2. Назначение данных: контроль спама, управление комментариями.
  3. Легитимация: ваше согласие
  4. Передача данных: данные не будут переданы третьим лицам, кроме как по закону.
  5. Хранение данных: база данных, размещенная в Occentus Networks (ЕС)
  6. Права: в любое время вы можете ограничить, восстановить и удалить свою информацию.

  1.   Габриэль де Лука сказал

    В поле редактирования справа вверху вы можете выделить весь текст, скопировать его в буфер обмена, а затем вставить куда хотите.