เครื่องมือ Speech to Text ของ Kdenlive นี่คือประสบการณ์ของฉัน

เครื่องมือพูดเป็นข้อความ

เมื่อสัปดาห์ที่แล้ว Pablinux ได้บอกคุณเกี่ยวกับ Kdenlive เวอร์ชันใหม่ซึ่งเป็นเครื่องมือตัดต่อวิดีโอจากโครงการ KDE ตามที่ฉันเคยแสดงความคิดเห็นฉันชอบ OpenShot ที่มีช่วงการเรียนรู้ที่ต่ำกว่า แต่เนื่องจากฉันสนใจเครื่องมือแปลงคำพูดเป็นข้อความที่มีในเวอร์ชันใหม่นี้มากฉันจึงตัดสินใจที่จะดูมัน

แม้ว่าฉันจะเขียนบทความเกี่ยวกับทางเลือกของ Linux สำหรับสิ่งนี้หรือโปรแกรม Windows นั้น (ไม่มีใครสามารถเรียกตัวเองว่าบล็อกเกอร์ Linux ได้หากพวกเขาไม่ได้เขียนหนึ่งในนั้น) นี่ไม่ใช่แนวทางที่ฉันชอบ ฉันคิดว่ารายการควรจะพูดคุยเกี่ยวกับลักษณะของตัวเอง ถ้าฉันต้องกำหนด Kdenlive ในทางใดทางหนึ่งฉันจะบอกว่ามันเป็นโปรแกรมตัดต่อวิดีโอสำหรับมือสมัครเล่นที่ต้องการให้งานสร้างสรรค์ของพวกเขาดูเป็นมืออาชีพ

ฉันเคยพูดในอดีตและฉันเก็บมันไว้ (มาทีละคน) ว่า ซอฟต์แวร์โอเพนซอร์สฟรีและมีไลบรารีสำหรับงานมัลติมีเดียที่ทำให้ผลิตภัณฑ์ Adobe และ Blackmagic ดูเหมือนของเล่นเท่านั้น. ปัญหาใหญ่คือไม่มีใครสนใจที่จะใส่เครื่องมือเหล่านี้ร่วมกับอินเทอร์เฟซที่เรียบง่ายและน่าดึงดูดและเอกสารประกอบที่สมบูรณ์และเข้าใจง่าย แม้ว่า Kdenlive จะยังห่างไกลจากการบรรลุเป้าหมาย แต่นักพัฒนาก็มาถูกทางแล้ว

ในกรณีของความสามารถในการแปลงเสียงพูดเป็นข้อความ Kdenlive ใช้เครื่องมือสองอย่างจากคลังแสงของที่เก็บของ ดัชนีแพ็คเกจ Python

Vosk เป็นชุดเครื่องมือการรู้จำเสียงแบบโอเพ่นซอร์สและออฟไลน์n. มีรูปแบบการรู้จำเสียงสำหรับ 17 ภาษาและภาษาถิ่น: อังกฤษ, อังกฤษอินเดียน, เยอรมัน, ฝรั่งเศส, สเปน, โปรตุเกส, จีน, รัสเซีย, ตุรกี, เวียดนาม, อิตาลี, ดัตช์, คาตาลัน, อาหรับ, กรีก, ฟาร์ซีและฟิลิปปินส์

Kdenlive ใช้โมเดล Vosk ผ่านโมดูลที่เขียนด้วย Python

อย่างไรก็ตามการมีการถอดเสียงนั้นไม่เพียงพอ คุณต้องซิงค์กับวิดีโอด้วย สำหรับสิ่งนี้เราต้องการโมดูลอื่นใน Python เพื่อสร้างคำบรรยาย

Kdenlive จะตรวจสอบว่าคุณได้ติดตั้งโมดูลเหล่านี้แล้ว ปในการดำเนินการนี้คุณต้องติดตั้งแพคเกจ python3-pip บนการแจกจ่ายของคุณก่อนจากนั้นเรียกใช้คำสั่ง:

pip3 install vosk

pip3 install srt

ต่อไปเราต้องติดตั้งโมเดลเสียง สำหรับสิ่งนี้เราเปิด Kdenlive และเราจะไป การตั้งค่ากำหนดค่า Kdenlive Speech เป็นข้อความ

ในการโหลดโมเดลคุณมีสองตัวเลือก: หรือดาวน์โหลดโมเดลจาก หน้านี้ และโหลดด้วยตนเอง (ก่อนอื่นคุณต้องทำเครื่องหมายในช่องโฟลเดอร์โมเด็มแบบกำหนดเอง) หรือวางลิงก์จากรายการที่แสดงหน้าเดียวกันนั้น

การใช้เครื่องมือ Speech to Text

  1. ตรวจสอบให้แน่ใจในเมนูมุมมองว่าคุณได้เปิดใช้งานตัวเลือกคำบรรยายแล้ว จากนั้นอัปโหลดวิดีโอที่คุณต้องการถอดเสียง
  2. ย้ายวิดีโอไปที่แทร็กวิดีโอแรกและเลื่อนเส้นสีน้ำเงินตามความยาวที่คุณต้องการถอดเสียง
  3. คลิกที่แท็บคำบรรยายจากนั้นคลิกที่เครื่องหมาย +
  4. คำใบ้จะถูกเพิ่มไว้ที่ด้านบน คลิกที่ไอคอนทางด้านซ้ายของดวงตา
  5. เลือกรูปแบบการถอดเสียงและหากคุณต้องการถอดเสียงคลิปคลิปทั้งหมดในไทม์ไลน์หรือบางส่วนของไทม์ไลน์ คลิกที่กระบวนการ

ฉันเปรียบเทียบ Speech กับเทคโนโลยีกับเครื่องมือระบบคลาวด์เวอร์ชันฟรีและได้เห็นวิดีโอที่มีคำบรรยายตัวเองจาก Youtube และแพลตฟอร์มหลักสูตรแบบชำระเงิน ฉันต้องบอกว่ามันไม่สมบูรณ์แบบ แต่ก็ไม่เลวร้ายไปกว่าทางเลือกที่กล่าวถึง เขามีปัญหาเมื่อคนที่พูดไม่มีสำนวนที่ดีหรือพูดเกินดนตรีหรือเสียงอื่น ๆ แต่พอนึกภาพคำถามที่พวกเขาถามฉันใช่มันใช้บรรยายซีรีส์หรือภาพยนตร์ได้ แม้ว่าเนื่องจากข้อ จำกัด ที่ระบุไว้อาจต้องทำด้วยมือ

และถ้าพวกที่ Kdenlive ใส่แบตเตอรี่ลงไปและรวมโมดูลการแปลเข้าด้วยกันสิ่งนี้ก็จะสมบูรณ์แบบ

มีบางอย่างที่ควรปรับปรุง วันนี้หากคุณต้องการเปลี่ยนลักษณะของคำบรรยายคุณจะต้องใส่รหัส และไม่มีวิธีใดในการส่งออก คุณจะสามารถเห็นได้เฉพาะที่ฝังอยู่ในวิดีโอเท่านั้น

แต่อย่างที่ฉันได้กล่าวไว้ข้างต้นไม่ต้องสงสัยเลยว่าโครงการมาถูกทางแล้ว


แสดงความคิดเห็นของคุณ

อีเมล์ของคุณจะไม่ถูกเผยแพร่ ช่องที่ต้องการถูกทำเครื่องหมายด้วย *

*

*

  1. รับผิดชอบข้อมูล: AB Internet Networks 2008 SL
  2. วัตถุประสงค์ของข้อมูล: ควบคุมสแปมการจัดการความคิดเห็น
  3. ถูกต้องตามกฎหมาย: ความยินยอมของคุณ
  4. การสื่อสารข้อมูล: ข้อมูลจะไม่ถูกสื่อสารไปยังบุคคลที่สามยกเว้นตามข้อผูกพันทางกฎหมาย
  5. การจัดเก็บข้อมูล: ฐานข้อมูลที่โฮสต์โดย Occentus Networks (EU)
  6. สิทธิ์: คุณสามารถ จำกัด กู้คืนและลบข้อมูลของคุณได้ตลอดเวลา

  1.   กาเบรียล เดอ ลูก้า dijo

    ในกล่องแก้ไขด้านขวาด้านบน คุณสามารถเลือกข้อความทั้งหมด คัดลอกไปที่คลิปบอร์ดแล้ววางที่ใดก็ได้ที่คุณต้องการ