Kdenlive的语音转文字工具。 这是我的经验

语音转文字工具

上周,Pablinux向您介绍了KDElive的新版本,它是KDE项目中的视频编辑工具。 正如我曾经评论过的那样,我更喜欢OpenShot,它的学习曲线较低,但是由于我对这个新版本所集成的语音转文本工具非常感兴趣,因此我决定对其进行研究。

尽管我已经写了很多关于Linux替代Windows或Windows程序的文章(如果没有写过其中一篇,没有人可以称自己为Linux博客),但这不是我喜欢的方法。 我认为应该根据程序的特点来讨论程序。 如果必须以任何方式定义Kdenlive,我会说它是视频爱好者的视频编辑器,他们希望他们的作品看起来很专业。

我过去说过,并坚持(一一列举) 免费和开源软件具有用于多媒体工作的库,这些库使Adobe和Blackmagic产品看起来像仅仅是玩具。 最大的问题是,没有人愿意将这些工具与一个简单且吸引人的界面以及完整且易于理解的文档结合在一起。 尽管Kdenlive尚未实现目标,但其开发人员却步入正轨。

在能够将语音转换为文本的情况下,Kdenlive使用两个工具来存储语音资源。 Python软件包索引。

Vosk是一个开源和离线语音识别工具包。 它提供了针对17种语言和方言的语音识别模型:英语,印度英语,德语,法语,西班牙语,葡萄牙语,中文,俄语,土耳其语,越南语,意大利语,荷兰语,加泰罗尼亚语,阿拉伯语,希腊语,波斯语和菲律宾语。

Kdenlive通过使用Python编写的模块使用Vosk模型。

但是,仅提供成绩单还不够。 您还必须将其与视频同步。 为此,我们需要使用Python中的另一个模块来创建字幕。

Kdenlive将检查您是否安装了这些模块。 P为此,您需要先在您的发行版上安装python3-pip软件包,然后运行以下命令:

pip3 install vosk

pip3 install srt

接下来,我们必须安装语音模型。 为此,我们打开Kdenlive,我们将 设置将Kdenlive语音配置为文本。

要加载模型,您有两个选择:或从以下位置下载模型 这页 并手动加载 (您必须首先选中“自定义调制解调器文件夹”框)或从显示同一页面的列表中粘贴链接。

使用语音转文字工具

  1. 确保在“查看”菜单中激活了“字幕”选项。 接下来,上传您想要转录的视频。
  2. 将视频移到第一个视频轨道,然后沿要转录的持续时间滑动蓝线。
  3. 单击字幕选项卡,然后单击+号
  4. 在顶部添加了提示。 单击眼睛左侧的图标。
  5. 选择转录模型,如果要转录片段,请选择时间轴或时间轴的一部分中的所有片段。 点击流程

我将语音技术与免费版本的云工具进行了比较,并观看了来自Youtube和付费课程平台的自带字幕的视频。 我必须说这不是完美的,但并不比所提到的替代方案差。 当说话者的口语不佳或听音乐或其他声音时,他会遇到问题。 但是,想像一下他们在问我一个问题,是的,它可以用来对电视连续剧或电影加字幕。 尽管由于指示的限制,它们可能必须手动完成。

而且,如果Kdenlive的家伙放一点电池并集成翻译模块,那将是完美的。

有一些可以改进的地方。 今天,如果您想更改字幕的外观,则必须插入代码。 而且,没有办法导出它们。 您将只能看到它们嵌入在视频中。

但是,正如我上面所说,毫无疑问,该项目正在正确的轨道上进行。


发表您的评论

您的电子邮件地址将不会被发表。 必填字段标有 *

*

*

  1. 负责资料:AB Internet Networks 2008 SL
  2. 数据用途:控制垃圾邮件,注释管理。
  3. 合法性:您的同意
  4. 数据通讯:除非有法律义务,否则不会将数据传达给第三方。
  5. 数据存储:Occentus Networks(EU)托管的数据库
  6. 权利:您可以随时限制,恢复和删除您的信息。

  1.   加布里埃尔德卢卡

    在右上角的编辑框中你可以选择所有的文本,复制到剪贴板然后粘贴到你想要的地方