পাঠ্য সরঞ্জামে কেডেনলাইভের স্পিচ। এটা আমার অভিজ্ঞতা

পাঠ্য সরঞ্জামে স্পিচ

গত সপ্তাহে, পাব্লিনাক্স আপনাকে কেডিএলাইভের নতুন সংস্করণ সম্পর্কে বলেছেন, কেডিএ প্রকল্প থেকে ভিডিও সম্পাদনা সরঞ্জাম। যেমনটি আমি একবার মন্তব্য করেছি, আমি ওপেনশটকে পছন্দ করি যার মধ্যে কম শিক্ষার বক্ররেখা রয়েছে তবেএই নতুন সংস্করণটি যে ভয়েস টু-টেক্সট সরঞ্জামটিতে অন্তর্ভুক্ত হয়েছে তাতে আমি খুব আগ্রহী ছিলাম, তাই আমি একবার দেখার সিদ্ধান্ত নিয়েছি।

যদিও আমি এই বা উইন্ডোজ প্রোগ্রামের লিনাক্স বিকল্পগুলিতে আমার অংশের নিবন্ধগুলি লিখেছি (সেগুলির মধ্যে একটি না লিখলে কেউ নিজেকে লিনাক্স ব্লগার বলতে পারে না), এটি আমার পছন্দ হওয়া মত নয়। আমি মনে করি যে প্রোগ্রামগুলি তাদের নিজস্ব বৈশিষ্ট্য দ্বারা কথা বলা উচিত। যদি আমাকে কোনওভাবে কেডেনলাইভকে সংজ্ঞায়িত করতে হয় তবে আমি বলব যে এটি শখের জন্য একটি ভিডিও সম্পাদক যারা তাদের তৈরিগুলি পেশাদার দেখাতে চায়।

আমি অতীতে বলেছি এবং আমি এটি রেখেছি (একে একে আসছি) যা ফ্রি এবং ওপেন সোর্স সফ্টওয়্যারটিতে মাল্টিমিডিয়া কাজের লাইব্রেরি রয়েছে যা অ্যাডোব এবং ব্ল্যাকমেজিক পণ্যগুলিকে নিছক খেলনার মতো দেখায়। বড় সমস্যাটি হ'ল কেউ এই সরঞ্জামগুলিকে একটি সাধারণ এবং আকর্ষণীয় ইন্টারফেসের সাথে একত্রে রাখার বিষয়ে আগ্রহী ছিল না এবং ডকুমেন্টেশন সম্পূর্ণ এবং সহজে বোঝে। যদিও কেডেনলাইভ তার লক্ষ্য অর্জন থেকে অনেক দূরে, এর বিকাশকারীরা সঠিক পথে আছে on

বক্তৃতাকে পাঠ্যে রূপান্তর করার দক্ষতার ক্ষেত্রে কেডেনলাইভ এর সংগ্রহস্থলের অস্ত্রাগার থেকে দুটি সরঞ্জাম ব্যবহার করে পাইথন প্যাকেজ সূচক।

ভস্ক একটি ওপেন সোর্স এবং অফলাইন স্পিচ স্বীকৃতি সরঞ্জামদণ্ডএন। এটি 17 টি ভাষা ও উপভাষার জন্য স্পিচ স্বীকৃতি মডেল সরবরাহ করে: ইংরেজি, ভারতীয় ইংরেজি, জার্মান, ফরাসি, স্পেনীয়, পর্তুগিজ, চীনা, রাশিয়ান, তুর্কি, ভিয়েতনামী, ইতালীয়, ডাচ, কাতালান, আরবি, গ্রীক, ফার্সি এবং ফিলিপিনো।

কেডেনলাইভ পাইথনে লিখিত মডিউলের মাধ্যমে ভস্ক মডেলগুলি ব্যবহার করে।

তবে প্রতিলিপি থাকা যথেষ্ট নয়। আপনাকে এটি ভিডিও সহ সিঙ্ক করতে হবে। এর জন্য আমাদের সাবটাইটেল তৈরি করার জন্য পাইথনে আরও একটি মডিউল প্রয়োজন।

কেডেনলাইভ পরীক্ষা করবে যে আপনি এই মডিউলগুলি ইনস্টল করেছেন। পিএটি করার জন্য আপনাকে প্রথমে আপনার বিতরণে পাইথন 3-পিপ প্যাকেজ ইনস্টল করতে হবে এবং তারপরে কমান্ডগুলি চালাতে হবে:

pip3 install vosk

pip3 install srt

এর পরে, আমাদের ভয়েস মডেলগুলি ইনস্টল করতে হবে। এর জন্য আমরা কেডেনলাইভ খুলি এবং আমরা যাচ্ছি সেটিংস কেডেনলাইভ স্পিচ টেক্সটে কনফিগার করে।

মডেলগুলি লোড করতে আপনার কাছে দুটি বিকল্প রয়েছে: বা এগুলি থেকে মডেলগুলি ডাউনলোড করুন এই পৃষ্ঠাটি এবং এগুলি ম্যানুয়ালি লোড করুন (আপনাকে অবশ্যই প্রথমে কাস্টম মডেম ফোল্ডার বাক্সটি পরীক্ষা করতে হবে) বা তালিকা থেকে লিঙ্কটি আটকানো হবে যা আপনাকে একই পৃষ্ঠাটি দেখায়।

স্পিচ টু টেক্সট টুল ব্যবহার করে

  1. ভিউ মেনুতে নিশ্চিত হয়ে নিন যে আপনার কাছে সাবটাইটেল বিকল্প সক্রিয় আছে। এরপরে, আপনি যে ভিডিওটি প্রতিলিপি করতে চান তা আপলোড করুন।
  2. ভিডিওটিকে প্রথম ভিডিও ট্র্যাকে নিয়ে যান এবং নকল রেখাটি আপনার অনুলিপি করতে চান সময়কালে স্লাইড করুন।
  3. সাবটাইটেল ট্যাবে ক্লিক করুন এবং তারপরে + চিহ্নে
  4. শীর্ষে একটি ইঙ্গিত যুক্ত করা হয়েছে। চোখের বাম দিকে আইকনটি ক্লিক করুন।
  5. প্রতিলিপি মডেলটি নির্বাচন করুন এবং আপনি যদি কোনও ক্লিপ প্রতিলিপি করতে চান তবে একটি সময়রেখায় বা টাইমলাইনের একটি অংশে সমস্ত ক্লিপগুলি। প্রক্রিয়া ক্লিক করুন

আমি স্পিচকে প্রযুক্তিকে মেঘ সরঞ্জামের মুক্ত সংস্করণের সাথে তুলনা করেছি এবং ইউটিউব এবং প্রদেয় কোর্স প্ল্যাটফর্মের থেকে স্ব-ক্যাপশনযুক্ত ভিডিও দেখেছি। আমার বলতে হবে যে এটি নিখুঁত নয়, তবে এটি উল্লিখিত বিকল্পগুলির চেয়ে খারাপ নয়। তাঁর সমস্যা আছে যখন যারা কথা বলেন তাদের ভাল কথাসাহিত্য হয় না বা গান বা অন্য কোনও শব্দ বাধাদান করে। তবে, তারা আমাকে যে প্রশ্নটি জিজ্ঞাসা করছে তা কল্পনা করে হ্যাঁ, এটি কোনও সিরিজ বা চলচ্চিত্রের উপশিরোনাম ব্যবহৃত হতে পারে। যদিও, নির্দেশিত সীমাবদ্ধতার কারণে সেগুলি হাতে হাতে সম্পূর্ণ হতে পারে।

এবং, কেডেনলাইভের ছেলেরা যদি ব্যাটারিগুলি কিছুটা রাখে এবং অনুবাদ মডিউলটি সংহত করে দেয় তবে জিনিসটি নিখুঁত হবে।

উন্নত করা যেতে পারে এমন কিছু আছে। আজ, আপনি যদি সাবটাইটেলগুলির চেহারা পরিবর্তন করতে চান তবে আপনাকে কোড sertোকাতে হবে। এবং, তাদের রফতানি করার কোনও উপায় নেই। আপনি কেবল তাদের ভিডিওতে এমবেড করা দেখতে পাবেন।

তবে, যেমন আমি উপরে বলেছি, নিঃসন্দেহে প্রকল্পটি সঠিক পথে রয়েছে।


আপনার মন্তব্য দিন

আপনার ইমেল ঠিকানা প্রকাশিত হবে না। প্রয়োজনীয় ক্ষেত্রগুলি দিয়ে চিহ্নিত করা *

*

*

  1. ডেটার জন্য দায়ী: AB ইন্টারনেট নেটওয়ার্ক 2008 SL
  2. ডেটার উদ্দেশ্য: নিয়ন্ত্রণ স্প্যাম, মন্তব্য পরিচালনা।
  3. আইনীকরণ: আপনার সম্মতি
  4. তথ্য যোগাযোগ: ডেটা আইনি বাধ্যবাধকতা ব্যতীত তৃতীয় পক্ষের কাছে জানানো হবে না।
  5. ডেটা স্টোরেজ: ওসেন্টাস নেটওয়ার্কস (ইইউ) দ্বারা হোস্ট করা ডেটাবেস
  6. অধিকার: যে কোনও সময় আপনি আপনার তথ্য সীমাবদ্ধ করতে, পুনরুদ্ধার করতে এবং মুছতে পারেন।

  1.   গ্যাব্রিয়েল ডি লুকা তিনি বলেন

    উপরের ডানদিকে সম্পাদনা বাক্সে আপনি সমস্ত পাঠ্য নির্বাচন করতে পারেন, এটি ক্লিপবোর্ডে অনুলিপি করুন এবং তারপরে আপনি যেখানে চান সেখানে পেস্ট করুন