Alat Pidato ke Teks Kdenlive. Ini pengalaman saya

Alat ucapan ke teks

Minggu lalu, Pablinux memberi tahu Anda tentang versi baru Kdenlive, alat pengeditan video dari proyek KDE. Seperti yang pernah saya komentari, saya lebih suka OpenShot yang memiliki kurva belajar lebih rendah, tetapiKarena saya sangat tertarik dengan alat suara-ke-teks yang digabungkan dengan versi baru ini, saya memutuskan untuk melihatnya.

Meskipun saya telah menulis bagian artikel saya tentang alternatif Linux untuk program Windows ini atau itu (Tidak ada yang dapat menyebut diri mereka blogger Linux jika mereka tidak menulis salah satunya), ini bukanlah pendekatan yang saya suka. Saya pikir program harus dibicarakan dengan karakteristiknya sendiri. Jika saya harus mendefinisikan Kdenlive dengan cara apa pun, saya akan mengatakan bahwa itu adalah editor video untuk penghobi yang ingin kreasi mereka terlihat profesional.

Saya telah mengatakan di masa lalu dan saya menyimpannya (datang satu per satu) itu perangkat lunak gratis dan sumber terbuka memiliki perpustakaan untuk pekerjaan multimedia yang membuat produk Adobe dan Blackmagic terlihat seperti mainan belaka. Masalah besarnya adalah tidak ada yang tertarik untuk menggabungkan alat-alat ini dengan antarmuka yang sederhana dan menarik serta dokumentasi yang lengkap dan mudah dipahami. Meskipun Kdenlive masih jauh dari mencapai tujuannya, para pengembangnya berada di jalur yang benar.

Dalam hal kemampuan untuk mengubah ucapan menjadi teks, Kdenlive menggunakan dua alat dari gudang penyimpanan Indeks Paket Python.

Vosk adalah toolkit pengenalan suara open source dan offlinen. Ini menawarkan model pengenalan ucapan untuk 17 bahasa dan dialek: Inggris, Inggris India, Jerman, Prancis, Spanyol, Portugis, Cina, Rusia, Turki, Vietnam, Italia, Belanda, Catalan, Arab, Yunani, Farsi, dan Filipina.

Kdenlive menggunakan model Vosk melalui modul yang ditulis dengan Python.

Namun, memiliki transkrip saja tidak cukup. Anda juga harus menyelaraskannya dengan video. Untuk ini kita membutuhkan modul lain dengan Python untuk membuat subtitle.

Kdenlive akan memeriksa apakah Anda telah menginstal modul-modul ini. P.Untuk melakukan ini, Anda perlu menginstal paket python3-pip di distribusi Anda dan kemudian menjalankan perintah:

pip3 install vosk

pip3 install srt

Selanjutnya, kita harus menginstal model suara. Untuk ini kami membuka Kdenlive dan kami akan melakukannya Pengaturan Mengkonfigurasi Kdenlive Speech to Text.

Untuk memuat model, Anda memiliki dua opsi: atau unduh model dari Halaman ini dan memuatnya secara manual (Anda harus terlebih dahulu mencentang kotak folder Modem khusus) atau tempel tautan dari daftar yang menunjukkan halaman yang sama kepada Anda.

Menggunakan alat Speech to Text

  1. Pastikan di menu Tampilan bahwa Anda telah mengaktifkan opsi subtitle. Selanjutnya, unggah video yang ingin Anda transkrip.
  2. Pindahkan video ke trek video pertama dan geser garis biru sepanjang durasi yang ingin Anda transkrip.
  3. Klik pada tab subtitle dan kemudian pada tanda +
  4. Petunjuk ditambahkan di atas. Klik ikon di sebelah kiri mata.
  5. Pilih model transkripsi dan jika Anda ingin mentranskripsikan klip, semua klip dalam garis waktu atau bagian dari garis waktu. Klik Proses

Saya membandingkan Speech dengan tech dengan versi gratis dari alat cloud, dan telah melihat video dengan teks sendiri dari Youtube dan platform kursus berbayar. Saya harus mengatakan bahwa ini tidak sempurna, tetapi tidak lebih buruk dari alternatif yang disebutkan. Dia memiliki masalah ketika mereka yang berbicara tidak memiliki diksi yang baik atau melakukannya karena musik atau suara lainnya. Tapi, membayangkan pertanyaan yang mereka tanyakan kepada saya, ya, itu bisa digunakan untuk subtitle sebuah serial atau film. Meskipun, karena keterbatasan yang ditunjukkan, mereka mungkin harus diselesaikan dengan tangan.

Dan, jika orang-orang di Kdenlive meluangkan sedikit baterai dan mengintegrasikan modul terjemahan, semuanya akan sempurna.

Ada sesuatu yang bisa diperbaiki. Hari ini, jika Anda ingin mengubah tampilan subtitle, Anda harus memasukkan kode. Dan, tidak ada cara untuk mengekspornya. Anda hanya akan dapat melihatnya tersemat dalam video.

Tapi, seperti yang saya katakan di atas, tanpa diragukan lagi proyek ini berada di jalur yang benar.


tinggalkan Komentar Anda

Alamat email Anda tidak akan dipublikasikan. Bidang yang harus diisi ditandai dengan *

*

*

  1. Bertanggung jawab atas data: AB Internet Networks 2008 SL
  2. Tujuan data: Mengontrol SPAM, manajemen komentar.
  3. Legitimasi: Persetujuan Anda
  4. Komunikasi data: Data tidak akan dikomunikasikan kepada pihak ketiga kecuali dengan kewajiban hukum.
  5. Penyimpanan data: Basis data dihosting oleh Occentus Networks (UE)
  6. Hak: Anda dapat membatasi, memulihkan, dan menghapus informasi Anda kapan saja.

  1.   gabriel de luca dijo

    Di kotak edit di kanan atas Anda dapat memilih semua teks, menyalinnya ke clipboard, lalu menempelkannya di mana pun Anda mau