Инструментът за реч към текст на Kdenlive. Това е моят опит

Инструмент за реч в текст

Миналата седмица Pablinux ви разказа за новата версия на Kdenlive, инструмента за редактиране на видео от проекта KDE. Както веднъж коментирах, предпочитам OpenShot, който има по-ниска крива на обучение, ноТъй като много се интересувах от инструмента за реч в текст, който тази нова версия включва, реших да го разгледам.

Въпреки че съм написал своя дял от статии за алтернативи на Linux на тази или онази програма на Windows (Никой не може да се нарече Linux блогър, ако не е написал нито една от тях), това не е подход, който ми харесва. Мисля, че за програмите трябва да се говори според техните собствени характеристики. Ако трябва да дефинирам Kdenlive по някакъв начин, ще кажа, че това е видео редактор за любители, които искат техните творения да изглеждат професионално.

В миналото съм казвал и го пазя (ела един по един) това безплатният софтуер с отворен код разполага с библиотеки за мултимедийна работа, които правят продуктите на Adobe и Blackmagic да изглеждат просто като играчки. Големият проблем е, че никой не се интересуваше да събере тези инструменти заедно с опростен и атрактивен интерфейс и пълна и лесна за разбиране документация. Въпреки че Kdenlive далеч не е постигнал целта си, разработчиците му са на прав път.

В случай на възможност за конвертиране на реч в текст, Kdenlive използва два инструмента от арсенала на хранилището на Индекс на пакети на Python.

Vosk е инструментариум за разпознаване на реч с отворен код и офлайнн. Той предлага модели за разпознаване на реч за 17 езика и диалекти: английски, индийски английски, немски, френски, испански, португалски, китайски, руски, турски, виетнамски, италиански, холандски, каталонски, арабски, гръцки, фарси и филипински.

Kdenlive използва Vosk модели чрез модул, написан на Python.

Наличието на препис обаче не е достатъчно. Освен това трябва да го синхронизирате с видеоклипа. За това се нуждаем от друг модул в Python за създаване на субтитри.

Kdenlive ще провери дали имате инсталирани тези модули. PЗа да направите това, първо трябва да инсталирате пакета python3-pip във вашата дистрибуция и след това да изпълните командите:

pip3 install vosk

pip3 install srt

След това трябва да инсталираме гласовите модели. За това отваряме Kdenlive и ще го направим Настройки Конфигурирайте Kdenlive Speech to Text.

За да заредите моделите, имате две възможности: или изтеглете моделите от тази страница и ги заредете ръчно (Първо трябва да поставите отметка в полето Персонализирани модемни папки) или да поставите връзката от списъка, който ви показва същата страница.

Използване на инструмента Speech to Text

  1. Уверете се, че в менюто Изглед сте активирали опцията за субтитрите. След това качете видеоклипа, който искате да транскрибирате.
  2. Преместете видеоклипа в първата видеозапис и плъзнете синята линия по дължината, която искате да транскрибирате.
  3. Кликнете върху раздела субтитри и след това върху знака +
  4. В горната част се добавя намек. Кликнете върху иконата отляво на окото.
  5. Изберете модела на транскрипция и ако искате да транскрибирате клип, всички клипове в времева линия или част от времевата линия. Щракнете върху Процес

Сравних Speech с технологията с безплатната версия на облачен инструмент и видях видеоклипове със собствени надписи от Youtube и платформи за платени курсове. Трябва да кажа, че не е перфектен, но не е по-лош от споменатите алтернативи. Той има проблеми, когато тези, които говорят, нямат добра дикция или го правят по музика или някакъв друг звук. Но, представяйки си въпроса, който ми задават, да, той може да се използва за субтитриране на сериал или филм. Въпреки че поради посочените ограничения може да се наложи да бъдат попълнени на ръка.

И ако момчетата от Kdenlive сложат малко батериите и интегрират модул за превод, нещото ще бъде перфектно.

Има нещо, което може да се подобри. Днес, ако искате да промените външния вид на субтитрите, ще трябва да вмъкнете код. И няма начин да ги експортирате. Ще можете да ги видите само вградени във видеото.

Но, както казах по-горе, без съмнение проектът е на прав път.


Оставете вашия коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *

*

*

  1. Отговорник за данните: AB Internet Networks 2008 SL
  2. Предназначение на данните: Контрол на СПАМ, управление на коментари.
  3. Легитимация: Вашето съгласие
  4. Съобщаване на данните: Данните няма да бъдат съобщени на трети страни, освен по законово задължение.
  5. Съхранение на данни: База данни, хоствана от Occentus Networks (ЕС)
  6. Права: По всяко време можете да ограничите, възстановите и изтриете информацията си.

  1.   габриел де лука каза той

    В полето за редактиране вдясно по-горе можете да изберете целия текст, да го копирате в клипборда и след това да го поставите където пожелаете