Kdenlives Speech to Text Tool. Das ist meine Erfahrung

Speech-to-Text-Tool

Letzte Woche hat Pablinux Ihnen von der neuen Version von Kdenlive erzählt, dem Videobearbeitungswerkzeug aus dem KDE-Projekt. Wie ich einmal kommentiert habe, bevorzuge ich OpenShot, das eine geringere Lernkurve hat, aberDa ich sehr an dem Speech-to-Text-Tool interessiert war, das diese neue Version enthält, habe ich beschlossen, es mir anzusehen.

Obwohl ich meinen Teil der Artikel über Linux-Alternativen zu diesem oder jenem Windows-Programm geschrieben habe (niemand kann sich selbst als Linux-Blogger bezeichnen, wenn er keinen davon geschrieben hat), ist dies kein Ansatz, den ich mag. Ich denke, dass Programme anhand ihrer eigenen Merkmale besprochen werden sollten. Wenn ich Kdenlive in irgendeiner Weise definieren muss, werde ich sagen, dass es ein Video-Editor für Hobbyisten ist, die möchten, dass ihre Kreationen professionell aussehen.

Ich habe in der Vergangenheit gesagt und ich behalte es (komm eins nach dem anderen) das Freie und Open-Source-Software verfügt über Bibliotheken für Multimedia-Arbeiten, mit denen Adobe- und Blackmagic-Produkte wie Spielzeug aussehen. Das große Problem ist, dass niemand daran interessiert war, diese Tools mit einer einfachen und attraktiven Oberfläche und einer vollständigen und leicht verständlichen Dokumentation zusammenzustellen. Obwohl Kdenlive sein Ziel noch lange nicht erreicht hat, sind seine Entwickler auf dem richtigen Weg.

Für die Konvertierung von Sprache in Text verwendet Kdenlive zwei Tools aus dem Arsenal des Repositorys von Python-Paketindex.

Vosk ist ein Open Source- und Offline-Spracherkennungs-Toolkitn. Es bietet Spracherkennungsmodelle für 17 Sprachen und Dialekte: Englisch, Indisches Englisch, Deutsch, Französisch, Spanisch, Portugiesisch, Chinesisch, Russisch, Türkisch, Vietnamesisch, Italienisch, Niederländisch, Katalanisch, Arabisch, Griechisch, Persisch und Philippinisch.

Kdenlive verwendet Vosk-Modelle über ein in Python geschriebenes Modul.

Es reicht jedoch nicht aus, das Transkript zu haben. Sie müssen es auch mit dem Video synchronisieren. Dazu benötigen wir ein weiteres Modul in Python zum Erstellen von Untertiteln.

Kdenlive überprüft, ob Sie diese Module installiert haben. P.Dazu müssen Sie zuerst das python3-pip-Paket auf Ihrer Distribution installieren und dann die folgenden Befehle ausführen:

pip3 install vosk

pip3 install srt

Als nächstes müssen wir die Sprachmodelle installieren. Dafür öffnen wir Kdenlive und wir werden Einstellungen Konfigurieren Sie Kdenlive Speech to Text.

Um die Modelle zu laden, haben Sie zwei Möglichkeiten: oder laden Sie die Modelle von herunter Diese Seite und laden Sie sie manuell (Sie müssen zuerst das Kontrollkästchen Benutzerdefinierte Modemordner aktivieren.) Oder fügen Sie den Link aus der Liste ein, die dieselbe Seite anzeigt.

Verwenden des Werkzeugs "Sprache in Text"

  1. Stellen Sie im Menü Ansicht sicher, dass die Option Untertitel aktiviert ist. Laden Sie als Nächstes das Video hoch, das Sie transkribieren möchten.
  2. Verschieben Sie das Video zur ersten Videospur und schieben Sie die blaue Linie entlang der Länge, die Sie transkribieren möchten.
  3. Klicken Sie auf die Registerkarte Untertitel und dann auf das + -Zeichen
  4. Oben wird ein Hinweis hinzugefügt. Klicken Sie auf das Symbol links neben dem Auge.
  5. Wählen Sie das Transkriptionsmodell aus und wenn Sie einen Clip transkribieren möchten, alle Clips in einer Timeline oder einem Teil der Timeline. Klicken Sie auf Verarbeiten

Ich habe Speech to Tech mit der kostenlosen Version eines Cloud-Tools verglichen und selbstbeschriftete Videos von Youtube und kostenpflichtigen Kursplattformen gesehen. Ich muss sagen, dass es nicht perfekt ist, aber es ist nicht schlechter als die genannten Alternativen. Er hat Probleme, wenn diejenigen, die sprechen, keine gute Sprache haben oder dies über Musik oder einen anderen Klang tun. Aber wenn man sich die Frage vorstellt, die sie mir stellen, kann sie verwendet werden, um eine Serie oder einen Film zu untertiteln. Aufgrund der angegebenen Einschränkungen müssen sie möglicherweise von Hand ausgefüllt werden.

Und wenn die Leute von Kdenlive die Batterien ein wenig einlegen und ein Übersetzungsmodul integrieren würden, wäre das Ding perfekt.

Es gibt etwas, das verbessert werden könnte. Wenn Sie heute das Erscheinungsbild der Untertitel ändern möchten, müssen Sie Code einfügen. Und es gibt keine Möglichkeit, sie zu exportieren. Sie können sie nur im Video eingebettet sehen.

Aber wie gesagt, ohne Zweifel ist das Projekt auf dem richtigen Weg.


Hinterlasse einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert mit *

*

*

  1. Verantwortlich für die Daten: AB Internet Networks 2008 SL
  2. Zweck der Daten: Kontrolle von SPAM, Kommentarverwaltung.
  3. Legitimation: Ihre Zustimmung
  4. Übermittlung der Daten: Die Daten werden nur durch gesetzliche Verpflichtung an Dritte weitergegeben.
  5. Datenspeicherung: Von Occentus Networks (EU) gehostete Datenbank
  6. Rechte: Sie können Ihre Informationen jederzeit einschränken, wiederherstellen und löschen.

  1.   Gabriel de Luca sagte

    Im Bearbeitungsfeld rechts oben können Sie den gesamten Text markieren, in die Zwischenablage kopieren und dann an der gewünschten Stelle einfügen