Eina Veu a text de Kdenlive. Aquesta és la meva experiència

Eina veu a text

La setmana passada, Pablinux els va parlar de la nova versió de Kdenlive, l'eina d'edició de vídeos de el projecte del KDE. Com vaig comentar alguna vegada, jo prefereixo OpenShot que té una corba d'aprenentatge menor, però, Com em va interessar molt l'eina de veu a text que incorpora aquesta nova versió, vaig decidir donar-li una mirada.

Encara que tinc escrita la meva quota d'articles sobre alternatives Linux a tal o qual programa de Windows (Ningú pot cridar-se a si mateix blocaire de Linux si no va escriure un d'aquests) no es tracta d'un enfocament que m'agradi. Crec que dels programes s'ha de parlar per les seves pròpies característiques. Si he de definir Kdenlive d'alguna manera, diré que es tracta d'un editor de vídeo per a aficionats que volen que les seves creacions llueixin professionals.

He dit en el passat i ho mantinc (vinguin d'a un) que el programari lliure i de codi obert té biblioteques per a treball multimèdia que fan quedar als productes d'Adobe i Blackmagic com a mers joguines. El gran problema és que ningú es va interessar en ajuntar aquestes eines amb una interfície simple i atractiva i una documentació completa i fàcil d'entendre. Encara Kdenlive està lluny d'haver aconseguit el seu objectiu, els seus desenvolupadors van pel camí correcte.

En el cas de la capacitat per convertir veu a text, Kdenlive recorre a dues eines de l'arsenal de l'repositori de l' Índex de paquets de Python.

Vosk és un conjunt d'eines de reconeixement de la parla de codi obert i sense conexión. Ofereix models de reconeixement de la parla per a 17 idiomes i dialectes: anglès, anglès indi, alemany, francès, espanyol, portuguès, xinès, rus, turc, vietnamita, italià, holandès, català, àrab, grec, farsi i filipí.

Kdenlive utilitza els models de Vosk mitjançant un mòdul escrit en Python.

No obstant això, no n'hi ha prou amb tenir la transcripció. També cal sincronitzar-la amb el vídeo. Per això necessitem un altre mòdul en Python per a la creació de subtítols.

Kdenlive comprovarà que tens instal·lat aquests mòduls. Per a fer-ho necessites primer instal·lar el paquet python3-pip al teu distribució i després executar les ordres:

pip3 install vosk

pip3 install srt

A continuació, hem d'instal·lar els models de veu. Per això vam obrir Kdenlive i anem a Arranjament Configura Kdenlive Speech to Text.

Per carregar els models tens dues opcions: o descarregar els models de aquesta pàgina i carregar-los manualment (Has de marcar primer el requadre Custom mòdem folders) o enganxar l'enllaç de la llista que et mostra aquesta mateixa pàgina.

Usant l'eina Veu a text

  1. Assegura't al menú Veure que tens activada l'opció de subtítols. A continuació, carrega el vídeo que vols transcriure.
  2. Mou el vídeo a la primera pista de vídeo i llisca la línia blava al llarg de la durada que vols transcriure.
  3. Prem a la pestanya subtítols ia continuació en el signe +
  4. A la part superior s'agrega una pista. Prem a la icona que està a l'esquerra de l'ull.
  5. Selecciona el model de transcripció i si vols transcriure un clip, tots els clips d'una línia de temps o una part de la línia de temps. Cliqueu a Process

Vaig comparar Speech to tech amb la versió gratuïta d'una eina en el núvol, i he vist vídeos acte subtitulats de Youtube i de plataformes de cursos de pagament. He de dir que no és perfecta, però no és pitjor que les alternatives esmentades. Té problemes quan els que parlen no tenen bona dicció o ho fan sobre música o algun altre so. Però, imaginant la pregunta que em estan fent, si, pot usar-se per subtitular una sèrie o pel·lícula. Encara que, per les limitacions assenyalades pot ser que calgui completar a mà.

I, si els nois de Kdenlive es posen una mica les piles i integren algun mòdul de traducció, la cosa seria perfecta.

Hi ha alguna cosa que podria millorar-se. Ara per ara, si vols canviar l'aparença dels subtítols, hauràs inserir codi. I, no hi ha forma de exportar-los. Només podràs veure'ls incrustats en el vídeo.

Però, com vaig dir més amunt, sense dubte el projecte va pel bon camí.


Deixa el teu comentari

La seva adreça de correu electrònic no es publicarà. Els camps obligatoris estan marcats amb *

*

*

  1. Responsable de les dades: AB Internet Networks 2008 SL
  2. Finalitat de les dades: Controlar l'SPAM, gestió de comentaris.
  3. Legitimació: El teu consentiment
  4. Comunicació de les dades: No es comunicaran les dades a tercers excepte per obligació legal.
  5. Emmagatzematge de les dades: Base de dades allotjada en Occentus Networks (UE)
  6. Drets: En qualsevol moment pots limitar, recuperar i esborrar la teva informació.

  1.   Gabriel de Luca va dir

    Al quadre d'edició a la dreta a dalt podeu seleccionar tot el text, copiar-lo al porta-retalls i després enganxar-lo on vulgueu