A Kdenlive Speech to Text eszköz. Ez az én tapasztalatom

Beszéd szöveggé eszköz

A múlt héten a Pablinux elmondta a Kdenlive új verzióját, a KDE projekt videószerkesztő eszközét. Amint egyszer megjegyeztem, inkább az OpenShot-ot részesítem előnyben, amelynek alacsonyabb a tanulási görbéje, deMivel nagyon érdekelt a beszéd-szöveg eszköz, amelyet ez az új verzió tartalmaz, úgy döntöttem, hogy megnézem.

Bár írtam a cikkeim részét a Windows ennek vagy annak a programnak az alternatíváiról (senki sem nevezheti magát Linux bloggernek, ha nem írt ilyet), ez nem egy olyan megközelítés, amelyet szeretek. Úgy gondolom, hogy a programokról saját jellemzőik szerint kell beszélni. Ha valamilyen módon meg kell határoznom a Kdenlive-t, akkor azt mondom, hogy egy videószerkesztő azoknak a hobbistáknak, akik azt akarják, hogy alkotásaik profinak tűnjenek.

Mondtam a múltban, és megtartom (jöjjön egyenként), hogy az ingyenes és nyílt forráskódú szoftvereknek vannak multimédiás munkáinak könyvtárai, amelyek az Adobe és a Blackmagic termékeket puszta játéknak tűnnek. A nagy probléma az, hogy senkit nem érdekelt ezeknek az eszközöknek az összeállítása egy egyszerű és vonzó kezelőfelülettel, valamint teljes és könnyen érthető dokumentációval. Bár a Kdenlive korántsem érte el célját, fejlesztői jó úton járnak.

A beszéd szöveggé alakításának képessége esetén a Kdenlive két eszközt használ a Python csomagindex.

A Vosk egy nyílt forráskódú és offline beszédfelismerő eszközkészletn. Beszédfelismerési modelleket kínál 17 nyelv és nyelvjárás számára: angol, indiai angol, német, francia, spanyol, portugál, kínai, orosz, török, vietnami, olasz, holland, katalán, arab, görög, perzsa és filippínó.

A Kdenlive a Vosk modelleket használja egy Pythonban írt modulon keresztül.

Az átirat birtoklása azonban nem elég. Szinkronizálnod kell a videóval is. Ehhez szükségünk van egy másik modulra a Pythonban a feliratok létrehozásához.

A Kdenlive ellenőrzi, hogy telepítve vannak-e ezek a modulok. PEhhez először telepítenie kell a python3-pip csomagot a disztribúcióra, majd futtatnia kell a parancsokat:

pip3 install vosk

pip3 install srt

Ezután telepítenünk kell a hangmodelleket. Ehhez megnyitjuk a Kdenlive-ot, és megyünk is Beállítások A Kdenlive Speech to Text konfigurálása.

A modellek betöltéséhez két lehetősége van: vagy töltse le a modelleket innen ezen az oldalon és kézzel töltse be őket (Először be kell jelölnie az Egyedi modem mappák jelölőnégyzetet), vagy be kell illesztenie a hivatkozást a listából, amely ugyanazt az oldalt mutatja.

A Beszéd szöveggé eszköz használata

  1. Győződjön meg arról, hogy a Nézet menüben be van-e kapcsolva a felirat. Ezután töltse fel az átírni kívánt videót.
  2. Vigye a videót az első videó sávra, és csúsztassa a kék vonalat az átírni kívánt hossz mentén.
  3. Kattintson a felirat fülre, majd a + jelre
  4. A tetején egy tipp található. Kattintson a szem bal oldalán található ikonra.
  5. Válassza ki az átírási modellt, és ha klipet szeretne átírni, akkor az összes klipet egy idővonalon vagy az idővonal egy részén. Kattintson a Feldolgozás gombra

Összehasonlítottam a Speech to tech-t a felhőeszköz ingyenes verziójával, és láttam saját felirattal ellátott videókat a Youtube-tól és a fizetős tanfolyamok platformjaitól. Azt kell mondanom, hogy nem tökéletes, de nem rosszabb, mint az említett alternatívák. Problémái vannak, amikor a beszélőknek nincs jó dikciójuk, vagy a zene vagy más hang miatt. De elképzelve azt a kérdést, amit feltesznek nekem, igen, fel lehet használni egy sorozat vagy film feliratozására. Bár a jelzett korlátozások miatt előfordulhat, hogy kézzel kell kitölteni őket.

És ha a Kdenlive srácai kissé felteszik az elemeket és integrálnak egy fordító modult, akkor a dolog tökéletes lenne.

Van, amin lehetne javítani. Ma, ha meg akarja változtatni a feliratok megjelenését, be kell illesztenie a kódot. És nem lehet exportálni őket. Csak beágyazva láthatja őket a videóba.

De, mint fentebb mondtam, a projekt minden kétséget kizáróan jó úton halad.


Hagyja megjegyzését

E-mail címed nem kerül nyilvánosságra. Kötelező mezők vannak jelölve *

*

*

  1. Az adatokért felelős: AB Internet Networks 2008 SL
  2. Az adatok célja: A SPAM ellenőrzése, a megjegyzések kezelése.
  3. Legitimáció: Az Ön beleegyezése
  4. Az adatok közlése: Az adatokat csak jogi kötelezettség alapján továbbítjuk harmadik felekkel.
  5. Adattárolás: Az Occentus Networks (EU) által üzemeltetett adatbázis
  6. Jogok: Bármikor korlátozhatja, helyreállíthatja és törölheti adatait.

  1.   gabriel de luca dijo

    A jobb oldali szerkesztőmezőben kijelölheti az összes szöveget, átmásolhatja a vágólapra, majd beillesztheti a kívánt helyre