Інструмент "Мовлення до тексту" Kdenlive. Це мій досвід

Інструмент мовлення до тексту

Минулого тижня Pablinux розповів вам про нову версію Kdenlive, інструмент для редагування відео з проекту KDE. Як я колись коментував, я віддаю перевагу OpenShot, який має нижчий рівень навчання, алеОскільки мене дуже зацікавив інструмент перетворення тексту в текст, який включає ця нова версія, я вирішив поглянути на нього.

Хоча я написав свою частину статей про альтернативи Linux тій чи іншій програмі Windows (ніхто не може назвати себе блогером Linux, якщо не написав жодної з них), це не такий підхід, який мені подобається. Я думаю, що про програми слід говорити за своїми особливостями. Якщо мені доводиться будь-яким чином визначати Kdenlive, я скажу, що це відеоредактор для любителів, які хочуть, щоб їх творіння виглядало професійно.

Я вже говорив у минулому, і я зберігаю це (приходьте по одному), що безкоштовне програмне забезпечення з відкритим кодом має бібліотеки для роботи з мультимедіа, завдяки яким продукти Adobe і Blackmagic виглядають як іграшки. Велика проблема полягає в тому, що нікому не було цікаво поєднувати ці інструменти разом із простим і привабливим інтерфейсом та повною та зрозумілою документацією. Хоча Kdenlive ще далеко не досяг своєї мети, його розробники йдуть на правильному шляху.

У випадку можливості перетворення мови в текст, Kdenlive використовує два інструменти з арсеналу сховища Індекс пакету Python.

Vosk - це інструментарій розпізнавання мовлення з відкритим кодом та офлайнп. Він пропонує моделі розпізнавання мови для 17 мов та діалектів: англійської, індійської, англійської, німецької, французької, іспанської, португальської, китайської, російської, турецької, в’єтнамської, італійської, голландської, каталонської, арабської, грецької, фарсі та філіппінської.

Kdenlive використовує моделі Vosk через модуль, написаний на Python.

Однак мати стенограму недостатньо. Ви також повинні синхронізувати його з відео. Для цього нам потрібен ще один модуль на Python для створення субтитрів.

Kdenlive перевірить, чи встановлені ці модулі. PДля цього вам потрібно спочатку встановити пакет python3-pip у вашому дистрибутиві, а потім виконати команди:

pip3 install vosk

pip3 install srt

Далі ми повинні встановити голосові моделі. Для цього ми відкриваємо Kdenlive і збираємось Налаштування Налаштування мови Kdenlive для тексту.

Щоб завантажити моделі, у вас є два варіанти: або завантажте моделі з цю сторінку і завантажте їх вручну (Спочатку потрібно встановити прапорець у полі Спеціальні папки модему) або вставити посилання зі списку, що відображає ту саму сторінку.

Використання інструменту «Мовлення в текст»

  1. Переконайтеся, що у меню Перегляд увімкнено опцію субтитрів. Потім завантажте відео, яке потрібно записати.
  2. Перемістіть відео на першу відеодоріжку та проведіть синьою лінією протягом тривалості, яку потрібно записати.
  3. Клацніть на вкладку субтитрів, а потім на знак +
  4. Угорі додається підказка. Клацніть на піктограму зліва від ока.
  5. Виберіть модель транскрипції, і якщо ви хочете переписати кліп, усі кліпи на часовій шкалі або на частині часової шкали. Клацніть на Process

Я порівняв Speech із технологіями із безкоштовною версією хмарного інструменту, і я бачив власні відео з Youtube та платних платформ курсів. Треба сказати, що це не ідеально, але це не гірше згаданих альтернатив. У нього виникають проблеми, коли ті, хто говорить, не мають хорошої дикції або роблять це через музику чи інший звук. Але, уявляючи собі запитання, яке вони мені задають, так, його можна використовувати для субтитрів серіалу чи фільму. Хоча, через зазначені обмеження, їх, можливо, доведеться заповнювати вручну.

І якби хлопці з Kdenlive трохи розрядили батареї та інтегрували модуль перекладу, це було б ідеально.

Є щось, що можна покращити. Сьогодні, якщо ви хочете змінити зовнішній вигляд субтитрів, вам доведеться вставити код. І, немає можливості експортувати їх. Ви зможете побачити їх лише вбудованими у відео.

Але, як я вже говорив вище, без сумніву, проект іде правильним шляхом.


Залиште свій коментар

Ваша електронна адреса не буде опублікований. Обов'язкові для заповнення поля позначені *

*

*

  1. Відповідальний за дані: AB Internet Networks 2008 SL
  2. Призначення даних: Контроль спаму, управління коментарями.
  3. Легітимація: Ваша згода
  4. Передача даних: Дані не передаватимуться третім особам, за винятком юридичних зобов’язань.
  5. Зберігання даних: База даних, розміщена в мережі Occentus Networks (ЄС)
  6. Права: Ви можете будь-коли обмежити, відновити та видалити свою інформацію.

  1.   Габріель де Лука - сказав він

    У полі редагування праворуч угорі ви можете вибрати весь текст, скопіювати його в буфер обміну, а потім вставити куди завгодно