Kdenlive의 Speech to Text 도구. 이것은 내 경험입니다

텍스트 음성 변환 도구

지난주 Pablinux는 KDE 프로젝트의 비디오 편집 도구 인 Kdenlive의 새 버전에 대해 설명했습니다. 제가 언급했듯이 저는 학습 곡선이 낮은 OpenShot을 선호하지만이 새 버전에 통합 된 음성-텍스트 도구에 관심이 많았 기 때문에 살펴보기로 결정했습니다.

이 프로그램이나 Windows 프로그램에 대한 Linux 대안에 대한 기사를 작성했지만 (그 중 하나를 작성하지 않으면 아무도 자신을 Linux 블로거라고 부를 수 없습니다) 이것은 내가 좋아하는 접근 방식이 아닙니다. 프로그램 자체의 특성에 따라 이야기해야한다고 생각합니다. 어떤 식 으로든 Kdenlive를 정의해야한다면, 자신의 창작물이 전문적으로 보이기를 원하는 애호가들을위한 비디오 편집기라고 말할 것입니다.

나는 과거에 말했고 나는 그것을 유지한다. 무료 및 오픈 소스 소프트웨어에는 Adobe 및 Blackmagic 제품을 단순한 장난감처럼 보이게하는 멀티미디어 작업용 라이브러리가 있습니다.. 큰 문제는 누구도 이러한 도구를 간단하고 매력적인 인터페이스와 완전하고 이해하기 쉬운 문서와 결합하는 데 관심이 없다는 것입니다. Kdenlive는 목표를 달성하지 못했지만 개발자는 올바른 방향으로 가고 있습니다.

음성을 텍스트로 변환하는 기능의 경우 Kdenlive는 저장소 저장소의 두 가지 도구를 사용합니다. Python 패키지 색인.

Vosk는 오픈 소스 및 오프라인 음성 인식 툴킷입니다.엔. 영어, 인도어 영어, 독일어, 프랑스어, 스페인어, 포르투갈어, 중국어, 러시아어, 터키어, 베트남어, 이탈리아어, 네덜란드어, 카탈로니아 어, 아랍어, 그리스어, 페르시아어, 필리핀어 등 17 개 언어 및 방언에 대한 음성 인식 모델을 제공합니다.

Kdenlive는 Python으로 작성된 모듈을 통해 Vosk 모델을 사용합니다.

그러나 성적 증명서가있는 것만으로는 충분하지 않습니다. 또한 비디오와 동기화해야합니다. 이를 위해서는 자막을 만들기위한 Python의 또 다른 모듈이 필요합니다.

Kdenlive는 이러한 모듈이 설치되어 있는지 확인합니다. 피이렇게하려면 먼저 배포에 python3-pip 패키지를 설치 한 다음 다음 명령을 실행해야합니다.

pip3 install vosk

pip3 install srt

다음으로 음성 모델을 설치해야합니다. 이를 위해 Kdenlive를 열고 설정 Kdenlive Speech to Text를 구성합니다.

모델을로드하려면 두 가지 옵션이 있습니다. 이 페이지 수동으로로드 (먼저 사용자 정의 모뎀 폴더 상자를 선택해야합니다) 또는 동일한 페이지를 표시하는 목록에서 링크를 붙여 넣으십시오.

음성을 텍스트로 도구 사용

  1. 보기 메뉴에서 자막 옵션이 활성화되어 있는지 확인하십시오. 다음으로 스크립트를 작성하려는 비디오를 업로드하십시오.
  2. 비디오를 첫 번째 비디오 트랙으로 이동하고 스크립트를 작성하려는 기간을 따라 파란색 선을 밉니다.
  3. 자막 탭을 클릭 한 다음 + 기호를 클릭합니다.
  4. 상단에 힌트가 추가됩니다. 눈 왼쪽에있는 아이콘을 클릭하십시오.
  5. 트랜스 크립 션 모델을 선택하고 클립, 타임 라인의 모든 클립 또는 타임 라인의 일부를 트랜스 크립 션하려는 경우. 프로세스를 클릭하십시오.

클라우드 도구의 무료 버전과 Speech to tech를 비교했으며 Youtube 및 유료 코스 플랫폼에서 자체 캡션 비디오를 보았습니다. 완벽하지는 않지만 언급 된 대안보다 나쁘지는 않다고 말해야합니다. 그는 말하는 사람들이 좋은 말을 가지고 있지 않거나 음악이나 다른 소리에 대해 그렇게 할 때 문제가 있습니다. 하지만 그들이 저에게 묻는 질문을 상상 해보면 네, 시리즈 나 영화의 자막을 만들 수 있습니다. 그러나 표시된 제한 사항으로 인해 손으로 작성해야 할 수도 있습니다.

그리고 Kdenlive의 직원이 배터리를 약간 넣고 번역 모듈을 통합하면 완벽 할 것입니다.

개선 할 수있는 것이 있습니다. 오늘은 자막의 모양을 바꾸고 싶다면 코드를 삽입해야합니다. 그리고 그들을 내보낼 방법이 없습니다. 동영상에 포함 된 항목 만 볼 수 있습니다.

그러나 위에서 말했듯이 의심 할 여지없이 프로젝트는 올바른 방향으로 진행되고 있습니다.


코멘트를 남겨주세요

귀하의 이메일 주소는 공개되지 않습니다. 필수 필드가 표시되어 있습니다 *

*

*

  1. 데이터 책임자: AB Internet Networks 2008 SL
  2. 데이터의 목적 : 스팸 제어, 댓글 관리.
  3. 합법성 : 귀하의 동의
  4. 데이터 전달 : 법적 의무에 의한 경우를 제외하고 데이터는 제 XNUMX 자에게 전달되지 않습니다.
  5. 데이터 저장소 : Occentus Networks (EU)에서 호스팅하는 데이터베이스
  6. 권리 : 귀하는 언제든지 귀하의 정보를 제한, 복구 및 삭제할 수 있습니다.

  1.   가브리엘 드 루카

    오른쪽 위의 편집 상자에서 모든 텍스트를 선택하고 클립보드에 복사한 다음 원하는 위치에 붙여넣을 수 있습니다.