כלי הדיבור לטקסט של Kdenlive. זו החוויה שלי

כלי דיבור לטקסט

בשבוע שעבר סיפרה לך Pablinux על הגרסה החדשה של Kdenlive, כלי עריכת הווידיאו מפרויקט KDE. כפי שהערתי פעם, אני מעדיף את OpenShot שיש לו עקומת למידה נמוכה יותר, אבלמכיוון שהתעניינתי מאוד בכלי הדיבור לטקסט שמשלב הגרסה החדשה הזו, החלטתי להביט בו.

למרות שכתבתי את מכסת המאמרים שלי על חלופות לינוקס לתוכנית Windows זו או אחרת (אף אחד לא יכול לקרוא לעצמו בלוגר לינוקס אם לא כתב אחד כזה), זו לא גישה שאני אוהבת. אני חושב שיש לדבר על תוכניות לפי המאפיינים שלהם. אם אצטרך להגדיר את Kdenlive בצורה כלשהי, אני אגיד שזה עורך וידאו לחובבים שרוצים שהיצירות שלהם ייראו מקצועיות.

אמרתי בעבר ואני שומר על זה (בוא אחד אחד) את זה בתוכנת קוד חופשי ופתוח יש ספריות לעבודות מולטימדיה שגורמות למוצרי אדובי ו- Blackmagic להראות כמו צעצועים בלבד. הבעיה הגדולה היא שאיש לא היה מעוניין להרכיב כלים אלה עם ממשק פשוט ומושך ותיעוד מלא וקל להבנה. Kdenlive אמנם רחוקה מלהשיג את מטרתה, אך המפתחים שלה בדרך הנכונה.

במקרה של היכולת להמיר דיבור לטקסט, Kdenlive משתמש בשני כלים מארסנל המאגר של אינדקס חבילות פייתון.

Vosk הוא ערכת כלים לזיהוי דיבור קוד פתוח ולא מקווןנ. הוא מציע מודלים לזיהוי דיבור עבור 17 שפות וניבים: אנגלית, אנגלית הודית, גרמנית, צרפתית, ספרדית, פורטוגזית, סינית, רוסית, טורקית, וייטנאמית, איטלקית, הולנדית, קטלאנית, ערבית, יוונית, פרסי ופיליפינית.

Kdenlive משתמש במודלים של Vosk באמצעות מודול שנכתב בפייתון.

עם זאת, אין די בתמלול. אתה צריך גם לסנכרן את זה עם הווידאו. לשם כך אנו זקוקים למודול נוסף בפייתון ליצירת כתוביות.

Kdenlive תבדוק שהתקנתם את המודולים הללו. פלשם כך עליך להתקין תחילה את חבילת ה- python3-pip בהפצה שלך ואז להפעיל את הפקודות:

pip3 install vosk

pip3 install srt

בשלב הבא עלינו להתקין את הדגמים הקוליים. בשביל זה אנחנו פותחים את Kdenlive ואנחנו הולכים הגדרות הגדר את Kdenlive דיבור לטקסט.

לטעינת הדגמים יש לך שתי אפשרויות: או להוריד את הדגמים מ esta página וטען אותם ידנית (תחילה עליך לסמן את התיבה תיקיות מודם מותאמות אישית) או להדביק את הקישור מהרשימה שמראה לך את אותו הדף.

שימוש בכלי דיבור לטקסט

  1. וודא שבתפריט תצוגה שהאפשרות כתוביות מופעלת. לאחר מכן, העלה את הסרטון שברצונך לתמלל.
  2. העבירו את הסרטון למסלול הווידיאו הראשון והחליקו את הקו הכחול לאורך משך הזמן שאתם רוצים לתמלל.
  3. לחץ על כרטיסיית הכתוביות ואז על סימן +
  4. בראש מתווסף רמז. לחץ על הסמל משמאל לעין.
  5. בחר את דגם התמלול ואם ברצונך לתמלל קליפ, את כל הקליפים בציר זמן או חלק מציר הזמן. לחץ על עיבוד

השוויתי דיבור לטכנולוגיה לגרסה החינמית של כלי ענן, וראיתי סרטונים עם כיתוב עצמי מ- Youtube ופלטפורמות קורס בתשלום. אני חייב לומר שזה לא מושלם, אבל זה לא יותר גרוע מהאלטרנטיבות שהוזכרו. יש לו בעיות כאשר לאלו שמדברים אין דיקציה טובה או עושים זאת על ידי מוזיקה או צליל אחר. אבל, לדמיין את השאלה שהם שואלים אותי, כן, ניתן להשתמש בה בכותרת משנה לסדרה או לסרט. למרות שבגלל המגבלות שצוינו, ייתכן שיהיה צורך להשלים אותן ביד.

ואם החבר'ה בקדנליב ישימו מעט את הסוללות וישלבו מודול תרגום, הדבר יהיה מושלם.

יש משהו שאפשר לשפר. היום, אם תרצו לשנות את מראה הכתוביות, תצטרכו להכניס קוד. ואין שום דרך לייצא אותם. תוכל לראות אותם מוטבעים רק בסרטון.

אבל, כפי שאמרתי לעיל, ללא ספק הפרויקט בדרך הנכונה.


השאירו את התגובה שלכם

כתובת הדוא"ל שלך לא תפורסם. שדות חובה מסומנים *

*

*

  1. אחראי על הנתונים: AB Internet Networks 2008 SL
  2. מטרת הנתונים: בקרת ספאם, ניהול תגובות.
  3. לגיטימציה: הסכמתך
  4. מסירת הנתונים: הנתונים לא יועברו לצדדים שלישיים אלא בהתחייבות חוקית.
  5. אחסון נתונים: מסד נתונים המתארח על ידי Occentus Networks (EU)
  6. זכויות: בכל עת תוכל להגביל, לשחזר ולמחוק את המידע שלך.

  1.   גבריאל דה לוקה דיג'ו

    בתיבת העריכה מימין למעלה תוכל לבחור את כל הטקסט, להעתיק אותו ללוח ולאחר מכן להדביק אותו היכן שתרצה