KdenliveのSpeechtoTextツール。 これは私の経験です

スピーチからテキストへのツール

先週、Pablinuxは、KDEプロジェクトのビデオ編集ツールであるKdenliveの新しいバージョンについて説明しました。 かつてコメントしたように、私は学習曲線が低いOpenShotを好みますが、この新しいバージョンに組み込まれている音声認識ツールに非常に興味があったので、それを見てみることにしました。

私はこれまたはそのWindowsプログラムに代わるLinuxに関する記事の割り当てを書いていますが(それらのいずれかを書かなかった場合、誰も自分自身をLinuxブロガーと呼ぶことはできません)、これは私が好きなアプローチではありません。 プログラムはそれぞれの特徴で語られるべきだと思います。 Kdenliveを何らかの方法で定義する必要がある場合、それは自分の作品をプロフェッショナルに見せたい愛好家のためのビデオエディターであると言えます。

私は過去に言った、そして私はそれを(一つずつ来る)それを保つ 無料のオープンソースソフトウェアには、AdobeおよびBlackmagic製品を単なるおもちゃのように見せるためのマルチメディア作業用のライブラリがあります。 大きな問題は、これらのツールをシンプルで魅力的なインターフェイスと完全で理解しやすいドキュメントにまとめることに誰も興味がなかったことです。 Kdenliveはその目標を達成するにはほど遠いですが、その開発者は正しい方向に進んでいます。

音声をテキストに変換する機能の場合、KdenliveはリポジトリのリポジトリにあるXNUMXつのツールを使用します。 Pythonパッケージインデックス。

Voskは、オープンソースのオフライン音声認識ツールキットです。n。 17の言語と方言の音声認識モデルを提供します:英語、インド英語、ドイツ語、フランス語、スペイン語、ポルトガル語、中国語、ロシア語、トルコ語、ベトナム語、イタリア語、オランダ語、カタロニア語、アラビア語、ギリシャ語、ペルシア語、フィリピン語。

Kdenliveは、Pythonで記述されたモジュールを介してVoskモデルを使用します。

ただし、トランスクリプトを持っているだけでは十分ではありません。 また、ビデオと同期する必要があります。 このために、字幕を作成するためのPythonの別のモジュールが必要です。

Kdenliveは、これらのモジュールがインストールされていることを確認します。 Pこれを行うには、最初にpython3-pipパッケージをディストリビューションにインストールしてから、次のコマンドを実行する必要があります。

pip3 install vosk

pip3 install srt

次に、音声モデルをインストールする必要があります。 このために、Kdenliveを開きます。 設定Kdenlive音声をテキストに設定します。

モデルをロードするには、XNUMXつのオプションがあります。または、からモデルをダウンロードします。 このページ 手動でロードします (最初に[カスタムモデムフォルダ]ボックスをオンにする必要があります)または、同じページを表示するリストからリンクを貼り付けます。

音声認識ツールの使用

  1. [表示]メニューで、字幕オプションがアクティブになっていることを確認してください。 次に、転記したい動画をアップロードします。
  2. ビデオを最初のビデオトラックに移動し、転写する時間に沿って青い線をスライドさせます。
  3. 字幕タブをクリックしてから、+記号をクリックします
  4. 上部にヒントが追加されます。 目の左側にあるアイコンをクリックします。
  5. トランスクリプションモデルを選択し、クリップをトランスクリプションする場合は、タイムライン内のすべてのクリップまたはタイムラインの一部を選択します。 プロセスをクリックします

私はSpeechto techを無料版のクラウドツールと比較し、Youtubeや有料コースプラットフォームからの自己キャプション付きのビデオを見てきました。 私はそれが完璧ではないと言わなければなりませんが、それは言及された選択肢よりも悪くはありません。 彼は、話す人が良い言葉を持っていないか、音楽や他の音についてそうしているときに問題を抱えています。 しかし、彼らが私に尋ねている質問を想像すると、そうです、それはシリーズや映画に字幕を付けるために使用することができます。 ただし、示されている制限により、手作業で完了する必要がある場合があります。

そして、Kdenliveのスタッフがバッテリーを少し入れて、翻訳モジュールを統合すれば、それは完璧です。

改善できることがあります。 今日、字幕の外観を変更したい場合は、コードを挿入する必要があります。 そして、それらをエクスポートする方法はありません。 あなたはそれらがビデオに埋め込まれているのを見ることができるだけです。

しかし、私が上で言ったように、間違いなくプロジェクトは正しい軌道に乗っています。


コメントを残す

あなたのメールアドレスが公開されることはありません。 必須フィールドには付いています *

*

*

  1. データの責任者:AB Internet Networks 2008 SL
  2. データの目的:SPAMの制御、コメント管理。
  3. 正当化:あなたの同意
  4. データの伝達:法的義務がある場合を除き、データが第三者に伝達されることはありません。
  5. データストレージ:Occentus Networks(EU)がホストするデータベース
  6. 権利:いつでも情報を制限、回復、削除できます。

  1.   ガブリエル・デ・ルカ

    右上の編集ボックスですべてのテキストを選択し、クリップボードにコピーして、任意の場所に貼り付けることができます。