Alat Teks Ucapan Kdenlive. Ini adalah pengalaman saya

Ucapan ke alat teks

Minggu lalu, Pablinux memberitahu anda mengenai versi baru Kdenlive, alat penyuntingan video dari projek KDE. Seperti yang pernah saya komen, saya lebih suka OpenShot yang mempunyai keluk pembelajaran yang lebih rendah, tetapiOleh kerana saya sangat berminat dengan alat ucapan-ke-teks yang digabungkan versi baru ini, saya memutuskan untuk melihatnya.

Walaupun saya telah menulis artikel saya mengenai alternatif Linux untuk program Windows atau ini (Tidak ada yang boleh menyebut diri mereka sebagai blogger Linux jika mereka tidak menulis salah satu daripadanya), ini bukan pendekatan yang saya suka. Saya berpendapat bahawa program harus dibincangkan dengan ciri-ciri mereka sendiri. Sekiranya saya harus mendefinisikan Kdenlive dengan cara apa pun, saya akan mengatakan bahawa itu adalah penyunting video untuk penggemar yang mahu ciptaan mereka kelihatan profesional.

Saya telah mengatakan pada masa lalu dan saya menyimpannya (datang satu persatu) bahawa perisian sumber bebas dan terbuka mempunyai perpustakaan untuk karya multimedia yang menjadikan produk Adobe dan Blackmagic kelihatan seperti mainan semata-mata. Masalah besarnya ialah tiada siapa yang berminat untuk meletakkan alat ini bersama antara muka yang ringkas dan menarik serta dokumentasi yang lengkap dan mudah difahami. Walaupun Kdenlive jauh dari mencapai matlamatnya, para pembangunnya berada di landasan yang betul.

Dalam kes kemampuan untuk menukar ucapan menjadi teks, Kdenlive menggunakan dua alat dari gudang repositori Indeks Pakej Python.

Vosk adalah sumber alat pengenalan ucapan sumber terbuka dan luar taliann. Ia menawarkan model pengecaman pertuturan untuk 17 bahasa dan dialek: Bahasa Inggeris, Bahasa Inggeris India, Jerman, Perancis, Sepanyol, Portugis, Cina, Rusia, Turki, Vietnam, Itali, Belanda, Catalan, Arab, Yunani, Farsi, dan Filipina.

Kdenlive menggunakan model Vosk melalui modul yang ditulis dalam Python.

Walau bagaimanapun, mempunyai transkrip tidak mencukupi. Anda juga harus menyegerakkannya dengan video. Untuk ini kita memerlukan modul lain di Python untuk membuat sari kata.

Kdenlive akan memastikan bahawa anda telah memasang modul ini. PUntuk melakukan ini, anda perlu memasang python3-pip pakej pada pengedaran anda dan kemudian jalankan arahan:

pip3 install vosk

pip3 install srt

Seterusnya, kita harus memasang model suara. Untuk ini kami membuka Kdenlive dan kami akan pergi Tetapan Konfigurasikan Ucapan Kdenlive ke Teks.

Untuk memuatkan model, anda mempunyai dua pilihan: atau muat turun model dari halaman ini dan memuatkannya secara manual (Anda mesti terlebih dahulu mencentang kotak folder modem Kustom) atau menampal pautan dari senarai yang menunjukkan halaman yang sama kepada anda.

Menggunakan alat Ucapan ke Teks

  1. Pastikan di menu Lihat bahawa pilihan sari kata diaktifkan. Seterusnya, muat naik video yang anda mahu salin.
  2. Pindahkan video ke trek video pertama dan luncurkan garis biru sepanjang panjang yang anda mahu salin.
  3. Klik pada tab sari kata dan kemudian pada tanda +
  4. Petunjuk ditambahkan di bahagian atas. Klik pada ikon di sebelah kiri mata.
  5. Pilih model transkripsi dan jika anda mahu menyalin klip, semua klip dalam garis masa atau sebahagian garis masa. Klik pada Proses

Saya membandingkan Ucapan dengan teknologi dengan versi percuma dari alat cloud, dan telah melihat video kapsyen diri dari Youtube dan platform kursus berbayar. Saya harus mengatakan bahawa ia tidak sempurna, tetapi tidak lebih buruk daripada alternatif yang disebutkan. Dia menghadapi masalah apabila mereka yang bercakap tidak mempunyai diksi yang baik atau lebih mengikut muzik atau bunyi lain. Tetapi, membayangkan soalan yang mereka ajukan kepada saya, ya, itu dapat digunakan untuk menyuburkan siri atau filem. Walaupun, kerana keterbatasan yang ditunjukkan, mereka mungkin harus diselesaikan dengan tangan.

Sekiranya lelaki di Kdenlive menggunakan bateri sedikit dan mengintegrasikan modul terjemahan, perkara itu akan sempurna.

Ada sesuatu yang boleh diperbaiki. Hari ini, jika anda ingin mengubah penampilan sari kata, anda perlu memasukkan kod. Tidak ada cara untuk mengeksportnya. Anda hanya dapat melihatnya tertanam dalam video.

Tetapi, seperti yang saya katakan di atas, tanpa keraguan projek ini berada di landasan yang betul.


Tinggalkan komen anda

Alamat email anda tidak akan disiarkan. Ruangan yang diperlukan ditanda dengan *

*

*

  1. Bertanggungjawab untuk data: AB Internet Networks 2008 SL
  2. Tujuan data: Mengendalikan SPAM, pengurusan komen.
  3. Perundangan: Persetujuan anda
  4. Komunikasi data: Data tidak akan disampaikan kepada pihak ketiga kecuali dengan kewajiban hukum.
  5. Penyimpanan data: Pangkalan data yang dihoskan oleh Occentus Networks (EU)
  6. Hak: Pada bila-bila masa anda boleh menghadkan, memulihkan dan menghapus maklumat anda.

  1.   gabriel de luca kata

    Dalam kotak edit di sebelah kanan di atas anda boleh memilih semua teks, salin ke papan keratan dan kemudian tampalkannya di mana-mana yang anda mahu