Narzędzie zamiany na tekst Kdenlive. To jest moje doświadczenie

Narzędzie zamiany mowy na tekst

W zeszłym tygodniu Pablinux powiedział ci o nowej wersji Kdenlive, narzędzia do edycji wideo z projektu KDE. Jak kiedyś powiedziałem, wolę OpenShot, który ma niższą krzywą uczenia się, alePonieważ byłem bardzo zainteresowany narzędziem zamiany mowy na tekst, które zawiera ta nowa wersja, postanowiłem się mu przyjrzeć.

Chociaż napisałem swoją część artykułów o alternatywach Linuksa do tego czy innego programu Windows (nikt nie może nazywać siebie blogerem Linuksa, jeśli nie napisał żadnego z nich), nie jest to podejście, które mi się podoba. Myślę, że o programach należy mówić według ich własnych cech. Jeśli muszę w jakikolwiek sposób zdefiniować Kdenlive, to powiem, że jest to edytor wideo dla hobbystów, którzy chcą, aby ich kreacje wyglądały profesjonalnie.

Mówiłem w przeszłości i trzymam to (przyjdź jeden po drugim) darmowe i otwarte oprogramowanie ma biblioteki do pracy multimedialnej, które sprawiają, że produkty Adobe i Blackmagic wyglądają jak zwykłe zabawki. Duży problem polega na tym, że nikt nie był zainteresowany zestawieniem tych narzędzi razem z prostym i atrakcyjnym interfejsem oraz pełną i łatwą do zrozumienia dokumentacją. Chociaż Kdenlive jest daleki od osiągnięcia swojego celu, jego twórcy są na dobrej drodze.

W przypadku możliwości konwersji mowy na tekst Kdenlive korzysta z dwóch narzędzi z arsenału repozytorium Indeks pakietów Pythona.

Vosk to zestaw narzędzi do rozpoznawania mowy typu open source i offlinen. Oferuje modele rozpoznawania mowy dla 17 języków i dialektów: angielski, indyjski angielski, niemiecki, francuski, hiszpański, portugalski, chiński, rosyjski, turecki, wietnamski, włoski, holenderski, kataloński, arabski, grecki, perski i filipiński.

Kdenlive używa modeli Vosk poprzez moduł napisany w Pythonie.

Jednak posiadanie transkrypcji nie wystarczy. Musisz także zsynchronizować go z wideo. Do tego potrzebujemy kolejnego modułu w Pythonie do tworzenia napisów.

Kdenlive sprawdzi, czy masz zainstalowane te moduły. P.Aby to zrobić, musisz najpierw zainstalować pakiet python3-pip w swojej dystrybucji, a następnie uruchomić polecenia:

pip3 install vosk

pip3 install srt

Następnie musimy zainstalować modele głosu. W tym celu otwieramy Kdenlive i zamierzamy Ustawienia Skonfiguruj mowę na tekst Kdenlive.

Aby załadować modele, masz dwie opcje: lub pobierz modele z ta strona i załaduj je ręcznie (Najpierw musisz zaznaczyć pole Niestandardowe foldery modemu) lub wkleić łącze z listy, która pokazuje tę samą stronę.

Korzystanie z narzędzia zamiana mowy na tekst

  1. Upewnij się, że w menu Widok masz włączoną opcję napisów. Następnie prześlij film, który chcesz transkrybować.
  2. Przenieś wideo na pierwszą ścieżkę wideo i przesuń niebieską linię wzdłuż czasu trwania transkrypcji.
  3. Kliknij zakładkę napisów, a następnie znak +
  4. Podpowiedź jest dodana u góry. Kliknij ikonę po lewej stronie oka.
  5. Wybierz model transkrypcji, a jeśli chcesz transkrybować klip, wszystkie klipy na osi czasu lub część osi czasu. Kliknij Przetwarzaj

Porównałem Mowę z technologią z bezpłatną wersją narzędzia w chmurze i widziałem filmy z napisami na YouTube i płatnych platform kursowych. Muszę powiedzieć, że nie jest doskonały, ale nie jest gorszy od wspomnianych alternatyw. Ma problemy, gdy ci, którzy mówią, nie mają dobrej dykcji lub robią to z powodu muzyki lub innego dźwięku. Ale wyobrażając sobie pytanie, które mi zadają, tak, można go użyć jako napisów do serialu lub filmu. Chociaż ze względu na wskazane ograniczenia mogą być konieczne ręczne wypełnienie.

A gdyby ludzie z Kdenlive trochę włożyli baterie i zintegrowaliby moduł tłumaczeniowy, byłoby idealnie.

Jest coś, co można by poprawić. Dziś, jeśli chcesz zmienić wygląd napisów, będziesz musiał wstawić kod. I nie ma sposobu, aby je wyeksportować. Będziesz mógł zobaczyć je tylko osadzone w filmie.

Ale, jak powiedziałem powyżej, bez wątpienia projekt jest na dobrej drodze.


Zostaw swój komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

*

*

  1. Odpowiedzialny za dane: AB Internet Networks 2008 SL
  2. Cel danych: kontrola spamu, zarządzanie komentarzami.
  3. Legitymacja: Twoja zgoda
  4. Przekazywanie danych: Dane nie będą przekazywane stronom trzecim, z wyjątkiem obowiązku prawnego.
  5. Przechowywanie danych: baza danych hostowana przez Occentus Networks (UE)
  6. Prawa: w dowolnym momencie możesz ograniczyć, odzyskać i usunąć swoje dane.

  1.   Gabriela de Luca powiedział

    W polu edycyjnym po prawej stronie powyżej możesz zaznaczyć cały tekst, skopiować go do schowka, a następnie wkleić w dowolnym miejscu