Kdenlive的語音轉文字工具。 這是我的經驗

語音轉文字工具

上週,Pablinux向您介紹了KDElive視頻編輯工具Kdenlive的新版本。 正如我曾經評論過的那樣,我更喜歡OpenShot,它的學習曲線較低,但是由於我對這個新版本所包含的語音到文本工具非常感興趣,因此我決定去看看。

儘管我已經撰寫了有關該Windows程序或Windows程序的Linux替代品的文章(如果沒有編寫其中一個,則沒有人可以稱自己為Linux博客),但這不是我喜歡的方法。 我認為應該根據程序的特點來討論程序。 如果我必須以任何方式定義Kdenlive,我會說它是視頻愛好者的視頻編輯器,他們希望他們的作品看起來很專業。

我過去曾說過,但我堅持不懈地(一一講) 免費和開源軟件具有用於多媒體工作的庫,這些庫使Adobe和Blackmagic產品看起來像僅僅是玩具。 最大的問題是,沒有人願意將這些工具與一個簡單且吸引人的界面以及完整且易於理解的文檔結合在一起。 儘管Kdenlive尚未實現目標,但其開發人員卻步入正軌。

在能夠將語音轉換為文本的情況下,Kdenlive使用了兩個工具來存儲語音資源。 Python軟件包索引。

Vosk是一個開源和離線語音識別工具包。 它提供了針對17種語言和方言的語音識別模型:英語,印度英語,德語,法語,西班牙語,葡萄牙語,中文,俄語,土耳其語,越南語,意大利語,荷蘭語,加泰羅尼亞語,阿拉伯語,希臘語,波斯語和菲律賓語。

Kdenlive通過使用Python編寫的模塊使用Vosk模型。

但是,僅提供成績單還不夠。 您還必須將其與視頻同步。 為此,我們需要使用Python中的另一個模塊來創建字幕。

Kdenlive將檢查您是否安裝了這些模塊。 P為此,您需要先在您的發行版上安裝python3-pip軟件包,然後運行以下命令:

pip3 install vosk

pip3 install srt

接下來,我們必須安裝語音模型。 為此,我們打開Kdenlive,我們將 設置將Kdenlive語音配置為文本。

要加載模型,您有兩個選擇:或從以下位置下載模型 這頁 並手動加載 (您必須首先選中“自定義調製解調器文件夾”框)或從顯示同一頁面的列表中粘貼鏈接。

使用語音轉文字工具

  1. 確保在“查看”菜單中激活了“字幕”選項。 接下來,上傳您想要轉錄的視頻。
  2. 將視頻移到第一個視頻軌道,然後沿要轉錄的持續時間滑動藍線。
  3. 單擊字幕選項卡,然後單擊+號
  4. 提示添加在頂部。 單擊眼睛左側的圖標。
  5. 選擇轉錄模型,如果要轉錄片段,請選擇時間軸或時間軸的一部分中的所有片段。 點擊流程

我將語音技術與免費版本的雲工具進行了比較,並觀看了來自Youtube和付費課程平台的自帶字幕的視頻。 我必須說這不是完美的,但並不比所提到的替代方案差。 當說話者的口語不佳或聽音樂或其他聲音時,他會遇到問題。 但是,想像一下他們在問我一個問題,是的,它可以用來對電視連續劇或電影加字幕。 儘管由於指示的限制,它們可能必須手動完成。

而且,如果Kdenlive的傢伙放一點電池並集成翻譯模塊,那將是完美的。

有一些可以改進的地方。 今天,如果您想更改字幕的外觀,則必須插入代碼。 而且,沒有辦法導出它們。 您將只能看到它們嵌入在視頻中。

但是,正如我上面所說,毫無疑問,該項目正在正確的軌道上進行。


發表您的評論

您的電子郵件地址將不會被發表。 必填字段標有 *

*

*

  1. 負責資料:AB Internet Networks 2008 SL
  2. 數據用途:控制垃圾郵件,註釋管理。
  3. 合法性:您的同意
  4. 數據通訊:除非有法律義務,否則不會將數據傳達給第三方。
  5. 數據存儲:Occentus Networks(EU)託管的數據庫
  6. 權利:您可以隨時限制,恢復和刪除您的信息。

  1.   加布里埃爾德盧卡 他說:

    在右上角的編輯框中你可以選擇所有的文本,複製到剪貼板然後粘貼到你想要的地方