Kdenliven puhe tekstiksi -työkalu. Tämä on kokemukseni

Puhe tekstiksi -työkalu

Viime viikolla Pablinux kertoi KDE-projektin videonmuokkaustyökalun Kdenlive uudesta versiosta. Kuten kerran kommentoin, pidän parempana OpenShotista, jolla on matalampi oppimiskäyrä, muttaKoska olin hyvin kiinnostunut tämän uuden version sisältämästä puheesta tekstiin -työkaluun, päätin tarkastella sitä.

Vaikka olen kirjoittanut osuuteni artikkeleista Linux-vaihtoehdoista tälle tai toiselle Windows-ohjelmalle (kukaan ei voi kutsua itseään Linux-bloggaajaksi, jos hän ei kirjoittanut yhtä niistä), tämä ei ole mielestäni lähestymistapa. Mielestäni ohjelmista tulisi puhua niiden omien ominaisuuksien mukaan. Jos minun on määriteltävä Kdenlive millään tavalla, sanon, että se on videoeditori harrastajille, jotka haluavat, että heidän luomuksensa näyttävät ammattimaisilta.

Olen sanonut aiemmin ja pidän sitä (tule yksi kerrallaan) ilmaisissa ja avoimen lähdekoodin ohjelmistoissa on kirjastoja multimediatyötä varten, jotka tekevät Adoben ja Blackmagicin tuotteista pelkät lelut. Suuri ongelma on, että kukaan ei ollut kiinnostunut näiden työkalujen yhdistämisestä yksinkertaisen ja houkuttelevan käyttöliittymän sekä täydellisen ja helposti ymmärrettävän dokumentaation kanssa. Vaikka Kdenlive ei ole läheskään saavuttanut tavoitettaan, sen kehittäjät ovat oikealla tiellä.

Jos kyky muuntaa puhe tekstiksi, Kdenlive käyttää kahta työkalua tietovaraston arkistosta. Python-pakettihakemisto.

Vosk on avoimen lähdekoodin ja offline-puheentunnistustyökalun. Se tarjoaa puheentunnistusmalleja 17 kielelle ja murteelle: englanti, intialainen englanti, saksa, ranska, espanja, portugali, kiina, venäjä, turkki, vietnam, italia, hollanti, katalaani, arabia, kreikka, farsi ja filippiiniläinen.

Kdenlive käyttää Vosk-malleja Pythonissa kirjoitetun moduulin kautta.

Litteraatin saaminen ei kuitenkaan riitä. Sinun on myös synkronoitava se videon kanssa. Tätä varten tarvitsemme toisen moduulin Pythonissa tekstitysten luomiseen.

Kdenlive tarkistaa, että nämä moduulit on asennettu. PTätä varten sinun on ensin asennettava python3-pip-paketti jakeluosi ja suoritettava komennot:

pip3 install vosk

pip3 install srt

Seuraavaksi meidän on asennettava äänimallit. Tätä varten avataan Kdenlive ja aiomme Asetukset Määritä Kdenlive Speech to Text.

Mallien lataamiseen on kaksi vaihtoehtoa: tai lataa mallit osoitteesta tämä sivu ja lataa ne manuaalisesti (Sinun on ensin tarkistettava Mukautetut modeemikansiot -ruutu) tai liitä linkki luettelosta, joka näyttää saman sivun.

Puhe tekstiksi -työkalun käyttäminen

  1. Varmista Näytä-valikossa, että tekstitysvaihtoehto on aktivoitu. Lataa seuraavaksi video, jonka haluat litteroida.
  2. Siirrä video ensimmäiseen videoraitaan ja liu'uta sinistä viivaa sen ajan mukaan, jonka haluat litteroida.
  3. Napsauta tekstitys-välilehteä ja sitten + -merkkiä
  4. Yläosaan lisätään vihje. Napsauta kuvaketta silmän vasemmalla puolella.
  5. Valitse transkriptiomalli ja jos haluat kirjoittaa leikkeen, kaikki leikkeet aikajanalla tai osa aikajanasta. Napsauta Process

Verroin Speech to tech -sovellusta pilvityökalun ilmaiseen versioon ja olen nähnyt itse kuvattuja videoita Youtubesta ja maksullisten kurssien alustoista. Minun on sanottava, että se ei ole täydellinen, mutta se ei ole huonompi kuin mainitut vaihtoehdot. Hänellä on ongelmia, kun puhuvilla ei ole hyvää sanamuotoa tai musiikin tai muun äänen takia. Mutta kuvitellessaan kysymyksen, jonka he kysyvät minulta, kyllä, sitä voidaan käyttää tekstittämään sarja tai elokuva. Ilmoitettujen rajoitusten vuoksi ne saatetaan joutua täyttämään käsin.

Ja jos Kdenliven kaverit asettavat paristot vähän ja integroivat käännösmoduulin, asia olisi täydellinen.

On jotain, jota voitaisiin parantaa. Jos haluat tänään muuttaa tekstityksen ulkonäköä, sinun on lisättävä koodi. Ja niitä ei ole mahdollista viedä. Näet ne vain upotettuna videoon.

Mutta kuten edellä sanoin, epäilemättä projekti on oikealla tiellä.


Kommentti, jätä sinun

Jätä kommentti

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *

*

*

  1. Vastaa tiedoista: AB Internet Networks 2008 SL
  2. Tietojen tarkoitus: Roskapostin hallinta, kommenttien hallinta.
  3. Laillistaminen: Suostumuksesi
  4. Tietojen välittäminen: Tietoja ei luovuteta kolmansille osapuolille muutoin kuin lain nojalla.
  5. Tietojen varastointi: Occentus Networks (EU) isännöi tietokantaa
  6. Oikeudet: Voit milloin tahansa rajoittaa, palauttaa ja poistaa tietojasi.

  1.   gabriel de luca dijo

    Yllä oikealla olevasta muokkauskentästä voit valita kaiken tekstin, kopioida sen leikepöydälle ja liittää sen sitten minne haluat