Nástroj pre reč na text od spoločnosti Kdenlive. Toto je moja skúsenosť

Nástroj na prevod reči na text

Minulý týždeň vám Pablinux povedal o novej verzii Kdenlive, nástroja na strih videa z projektu KDE. Ako som už raz uviedol, uprednostňujem OpenShot, ktorý má nižšiu krivku učenia, alePretože ma veľmi zaujímal nástroj na prevod reči na text, ktorý táto nová verzia obsahuje, rozhodol som sa ho pozrieť.

Aj keď som napísal svoju kvótu článkov o alternatívach Linuxu k tomu či onému programu pre Windows (Nikto sa nemôže nazývať blogerom pre Linux, ak by nenapísal ani jeden z nich), nie je to prístup, ktorý sa mi páči. Myslím si, že o programoch by sa malo hovoriť podľa ich vlastných charakteristík. Ak mám Kdenlive nejako definovať, poviem, že je to video editor pre fandov, ktorí chcú, aby ich výtvory pôsobili profesionálne.

Už som v minulosti hovoril a zachovávam to (po jednom) bezplatný a otvorený softvér má knižnice pre multimediálnu prácu, vďaka ktorým vyzerajú produkty Adobe a Blackmagic ako obyčajné hračky. Veľkým problémom je, že nikoho nezaujímalo spojenie týchto nástrojov s jednoduchým a atraktívnym rozhraním a úplnou a ľahko zrozumiteľnou dokumentáciou. Aj keď program Kdenlive zďaleka nedosiahol svoj cieľ, jeho vývojári sú na dobrej ceste.

V prípade možnosti prevodu reči na text používa Kdenlive dva nástroje z arzenálu úložiska Register balíkov Python.

Vosk je open source a offline sada nástrojov na rozpoznávanie rečin. Ponúka modely rozpoznávania reči pre 17 jazykov a dialektov: angličtina, indická angličtina, nemčina, francúzština, španielčina, portugalčina, čínština, ruština, turečtina, vietnamčina, taliančina, holandčina, katalánčina, arabčina, gréčtina, perzština a filipínčina.

Kdenlive používa modely spoločnosti Vosk prostredníctvom modulu napísaného v jazyku Python.

Prepis však nestačí. Musíte ich tiež synchronizovať s videom. Na to potrebujeme v Pythone ďalší modul na vytváranie titulkov.

Kdenlive skontroluje, či máte tieto moduly nainštalované. PAby ste to dosiahli, musíte si do svojej distribúcie najskôr nainštalovať balík python3-pip a potom spustiť príkazy:

pip3 install vosk

pip3 install srt

Ďalej musíme nainštalovať hlasové modely. Za týmto účelom otvoríme Kdenlive a chystáme sa Nastavenia Konfigurácia Kdenlive reči na text.

Na načítanie modelov máte dve možnosti: alebo si môžete modely stiahnuť z Táto stránka a načítať ich ručne (Najprv musíte začiarknuť políčko Prispôsobené priečinky modemu) alebo vložiť odkaz zo zoznamu, ktorý zobrazuje tú istú stránku.

Používanie nástroja Reč na text

  1. Uistite sa, že v ponuke Zobraziť máte aktivovanú možnosť titulkov. Ďalej nahrajte video, ktoré chcete prepísať.
  2. Presuňte video na prvú stopu videa a posuňte modrú čiaru pozdĺž doby, ktorú chcete prepísať.
  3. Kliknite na kartu titulkov a potom na znamienko +
  4. V hornej časti je pridaný náznak. Kliknite na ikonu vľavo od oka.
  5. Vyberte model prepisu a ak chcete prepisovať klip, všetky klipy na časovej osi alebo v časti časovej osi. Kliknite na Spracovať

Porovnal som Speech s tech s bezplatnou verziou cloudového nástroja a videl som videá s vlastným titulkom z Youtube a platených kurzových platforiem. Musím povedať, že nie je dokonalý, ale nie je o nič horší ako spomínané alternatívy. Má problémy, keď tí, ktorí hovoria, nemajú dobrú dikciu alebo hudbu alebo iný zvuk. Ale keď si predstavím otázku, ktorú mi kladú, dá sa to použiť na titulkovanie seriálu alebo filmu. Aj keď z dôvodu uvedených obmedzení bude pravdepodobne potrebné ich dokončiť ručne.

A ak by chlapci v Kdenlive trochu vložili batérie a integrovali prekladový modul, bolo by to dokonalé.

Je niečo, čo by sa dalo vylepšiť. Dnes, ak chcete zmeniť vzhľad titulkov, budete musieť vložiť kód. A neexistuje spôsob, ako ich exportovať. Uvidíte ich iba vo videu.

Ale ako som už uviedol vyššie, projekt je nepochybne na dobrej ceste.


Zanechajte svoj komentár

Vaša e-mailová adresa nebude zverejnená. Povinné položky sú označené *

*

*

  1. Za údaje zodpovedá: AB Internet Networks 2008 SL
  2. Účel údajov: Kontrolný SPAM, správa komentárov.
  3. Legitimácia: Váš súhlas
  4. Oznamovanie údajov: Údaje nebudú poskytnuté tretím stranám, iba ak to vyplýva zo zákona.
  5. Ukladanie dát: Databáza hostená spoločnosťou Occentus Networks (EU)
  6. Práva: Svoje údaje môžete kedykoľvek obmedziť, obnoviť a vymazať.

  1.   gabriel de luca dijo

    V poli úprav vpravo hore môžete vybrať celý text, skopírovať ho do schránky a potom ho prilepiť kamkoľvek chcete