Kdenlives tal till textverktyg. Det här är min erfarenhet

Tal till textverktyg

Förra veckan berättade Pablinux om den nya versionen av Kdenlive, videoredigeringsverktyget från KDE-projektet. Som jag en gång kommenterade föredrar jag OpenShot som har lägre inlärningskurva, menEftersom jag var mycket intresserad av tal-till-text-verktyget som den här nya versionen innehåller, bestämde jag mig för att titta på det.

Även om jag har skrivit min andel artiklar om Linux-alternativ till det här eller det andra Windows-programmet (Ingen kan kalla sig en Linux-bloggare om de inte skrev en av dem), så är det inte ett tillvägagångssätt som jag gillar. Jag tycker att man bör prata om program utifrån sina egna egenskaper. Om jag måste definiera Kdenlive på något sätt kommer jag att säga att det är en videoredigerare för hobbyister som vill att deras skapelser ska se professionella ut.

Jag har sagt tidigare och jag behåller det (kommer en efter en) att gratis programvara med öppen källkod har bibliotek för multimediaarbete som får Adobe- och Blackmagic-produkter att se ut som leksaker. Det stora problemet är att ingen var intresserad av att sätta ihop dessa verktyg med ett enkelt och attraktivt gränssnitt och komplett och lättförståelig dokumentation. Även om Kdenlive långt ifrån har uppnått sitt mål, är dess utvecklare på rätt väg.

När det gäller möjligheten att konvertera tal till text använder Kdenlive två verktyg från arsenalen i förvaret i Python-paketindex.

Vosk är en öppen källkod och offline verktyg för verktyg för taligenkänningn. Det erbjuder taligenkänningsmodeller för 17 språk och dialekter: engelska, indiska engelska, tyska, franska, spanska, portugisiska, kinesiska, ryska, turkiska, vietnamesiska, italienska, nederländska, katalanska, arabiska, grekiska, farsi och filippinska.

Kdenlive använder Vosk-modeller genom en modul skriven i Python.

Att ha transkriptionen är dock inte tillräckligt. Du måste också synkronisera den med videon. För detta behöver vi en annan modul i Python för att skapa undertexter.

Kdenlive kontrollerar att du har installerat dessa moduler. PFör att göra detta måste du först installera python3-pip-paketet på din distribution och sedan köra kommandona:

pip3 install vosk

pip3 install srt

Därefter måste vi installera röstmodellerna. För detta öppnar vi Kdenlive och vi ska Inställningar Konfigurera Kdenlive-tal till text.

För att ladda modellerna har du två alternativ: eller ladda ner modellerna från sidan och ladda dem manuellt (Du måste först markera rutan Anpassade modemmappar) eller klistra in länken från listan som visar samma sida.

Med verktyget Tal till text

  1. Kontrollera att undertexter är aktiverade i menyn Visa. Ladda sedan upp videon du vill transkribera.
  2. Flytta videon till det första videospåret och skjut den blå linjen längs den tid du vill transkribera.
  3. Klicka på undertexten och sedan på + -tecknet
  4. Högst upp läggs en ledtråd till. Klicka på ikonen till vänster om ögat.
  5. Välj transkriptionsmodell och om du vill transkribera ett klipp, alla klipp i en tidslinje eller en del av tidslinjen. Klicka på Process

Jag jämförde tal med teknik med den fria versionen av ett molnverktyg och har sett videoklipp från Youtube och betalda kursplattformar. Jag måste säga att det inte är perfekt, men det är inte värre än de nämnda alternativen. Han har problem när de som talar inte har bra diktion eller gör det över musik eller något annat ljud. Men, föreställa mig frågan de ställer mig, ja, den kan användas för att undertexta en serie eller film. På grund av de angivna begränsningarna kan de behöva fyllas i för hand.

Och om killarna på Kdenlive lägger batterierna lite och integrerar en översättningsmodul, så skulle saken vara perfekt.

Det finns något som kan förbättras. Idag, om du vill ändra undertexternas utseende, måste du infoga kod. Och det finns inget sätt att exportera dem. Du kommer bara att kunna se dem inbäddade i videon.

Men som jag sa ovan är projektet utan tvekan på rätt väg.


Lämna din kommentar

Din e-postadress kommer inte att publiceras. Obligatoriska fält är markerade med *

*

*

  1. Ansvarig för data: AB Internet Networks 2008 SL
  2. Syftet med uppgifterna: Kontrollera skräppost, kommentarhantering.
  3. Legitimering: Ditt samtycke
  4. Kommunikation av uppgifterna: Uppgifterna kommer inte att kommuniceras till tredje part förutom enligt laglig skyldighet.
  5. Datalagring: databas värd för Occentus Networks (EU)
  6. Rättigheter: När som helst kan du begränsa, återställa och radera din information.

  1.   gabriel de luca sade

    I redigeringsrutan till höger ovan kan du markera all text, kopiera den till klippbordet och sedan klistra in den var du vill