বিভিন্ন কারণে; অক্ষমতা, ভ্রমণ বা অপেক্ষার সময় বা শুধুমাত্র ব্যক্তিগত পছন্দ দ্বারা সুবিধা গ্রহণের ইচ্ছা, কম্পিউটার আমাদের যে সম্ভাবনা দেয় পাঠ্যকে অডিওতে রূপান্তর করা, এটি পড়ে বা পরে শুনতে একটি ফাইলে রূপান্তর করা, একটি বহুল ব্যবহৃত বৈশিষ্ট্য।
উইন্ডোজ এবং অ্যান্ড্রয়েড নেটিভভাবে পড়ার ক্ষমতা রাখে কণ্ঠস্বর দিয়ে, যদিও তারা কিছু বৈশিষ্ট্য বজায় রাখে যা তাদের কৃত্রিম উৎপত্তি চিহ্নিত করে চলেছে, তবুও কানের কাছে আনন্দদায়ক।
এর সাথে যোগ করা হয়েছে ফ্রি এবং পেইড প্রোগ্রামগুলির একটি সিরিজ যা এই বৈশিষ্ট্যগুলির সর্বাধিক ব্যবহার করে।
উইন্ডোজকে অর্থ প্রদান করা এবং অ্যান্ড্রয়েড গুগলের জন্য ডেটা সংগ্রহ করে তা মনে রাখার পরে, আমাদের কী বলতে হবেই লিনাক্স এখনও পর্যন্ত দাগ কাটেনি, তবুও আমরা সফল ফলাফল অর্জন করতে পারি। অন্যদিকে, যদিও এই নিবন্ধে বাণিজ্যিক-গ্রেড লিনাক্সের বিকল্প রয়েছে (এবং অবশ্যই আপনাকে অর্থ প্রদান করতে হবে) আমরা বিনামূল্যে এবং ওপেন সোর্স বিকল্পগুলিতে মনোনিবেশ করতে যাচ্ছি।
পাঠ্যকে বাক্যে রূপান্তর করার সরঞ্জাম
বক্তৃতা-প্রেরক
আপনি যদি ক্যালিবার ই-বুক ভিউয়ার ব্যবহার করেন, আপনি দেখতে পাবেন যে লিনাক্সে এটি আপনাকে স্পিচ-ডিসপ্যাচার নামে একটি প্যাকেজ ইনস্টল করতে বলে। এই সিস্টেম ডেমন সেই প্রোগ্রামগুলির মধ্যে একটি যোগসূত্র হিসেবে কাজ করে যা পাঠ্যকে বক্তৃতায় রূপান্তর করতে চায় এবং যে প্রোগ্রামগুলি বক্তৃতা সংশ্লেষণ পরিচালনা করে।
এই নিবন্ধে আলোচিত প্রোগ্রামগুলির মধ্যে Espeak এবং উৎসবের সাথে কাজ করে।
এটি একটি অ্যাপ্লিকেশন যা সংগ্রহস্থলে রয়েছে যাতে আপনি প্যাকেজ ম্যানেজার থেকে এটি ইনস্টল করার জন্য নাম দিয়ে অনুসন্ধান করতে পারেন।
Espeak / Espeak NG
নিম্নলিখিত কমান্ডগুলি পরীক্ষা করতে, আপনাকে একটি পাঠ্য ফাইল তৈরি করতে হবে, কিছু লিখতে হবে এবং এটি test.txt হিসাবে সংরক্ষণ করতে হবে
Espeak একটি টেক্সট-টু-স্পিচ ইউটিলিটি যা অনেক লিনাক্স ডিস্ট্রিবিউশনের স্ক্রিন রিডিং টুলস দ্বারা ব্যবহৃত হয় সুতরাং আপনি এটি এর সংগ্রহস্থল থেকে ইনস্টল করতে পারেন। এটি কমান্ড লাইন থেকে এবং গ্রাফিক্যাল ইন্টারফেস যেমন Gespeaker বা Kmouth (উভয় সংগ্রহস্থলে) সহ প্রোগ্রামগুলির মাধ্যমে ব্যবহার করা হয়।
Espeak এ পাওয়া বেশিরভাগ কণ্ঠস্বর রোবটিক, কিন্তু, তারা বেশ ভালভাবে বোঝা যায় এবং, তাদের ব্যবহারের জন্য কোন সীমাবদ্ধতা নেই।
Espeak NG আগেরটির একটি কমপ্যাক্ট ভার্সন।
একটি ফাইলকে টেক্সট থেকে স্পিচে রূপান্তর করতে
স্পেন থেকে স্প্যানিশ
espeak -f prueba.txt -v es -w prueba.wav
ল্যাটিন আমেরিকান স্প্যানিশ
espeak -f prueba.txt -v es-419 -w prueba.wav
সাহায্য এবং আরো তথ্য
man espeak
উত্সব
সংগ্রহস্থলে উপলব্ধ আরেকটি সরঞ্জাম হল উৎসব। এতে আমরা যা লিখছি তা পড়ার সম্ভাবনা ছাড়াও আগের দুটির একই বৈশিষ্ট্য অন্তর্ভুক্ত।
আমরা ইনস্টল করা ভাষার তালিকা দেখতে পারি:
ls /usr/share/festival/languages/
একটি ফাইল পড়ুন
festival --language castillian_spanish --tts prueba.txt
আরও তথ্য
man festival
স্প্যানিশ ভাষায় ডিফল্ট ভয়েস স্পষ্ট, যদিও রোবোটিক, কিন্তু ডিপথংগুলির সমস্যা রয়েছে। উৎসব অডিও ফাইল তৈরি করে না।
পিকো টেক্সট টু স্পিচ ইঞ্জিন
এটি অ্যান্ড্রয়েডের ওপেন সোর্স সংস্করণের স্পিচ সিনথেসাইজার। ভয়েস অনেক বেশি স্বাভাবিক, যদিও এটি পাঠ্যের দৈর্ঘ্যের উপর বিধিনিষেধ রাখে। আপনি এটি ibttspico-utils নামে সংগ্রহস্থলে খুঁজে পেতে পারেন।
পাঠ্য থেকে ভয়েস ফাইলে রূপান্তর করতে আমরা কমান্ডটি ব্যবহার করি:
pico2wave -l es-ES -w prueba.wav "$(cat prueba.txt)"
আমরা লিখে আরও তথ্য পেতে পারি:
pico2wave - সাহায্য
জিটিটিএস
এই আবেদন একটি শব্দ উচ্চারণ প্রদর্শনের জন্য গুগল ট্রান্সলেট একই লাইব্রেরি ব্যবহার করে। যদিও এটি সংগ্রহস্থলে রয়েছে, এটি হতে পারে কারণ এটি একটি পুরানো সংস্করণ, এটি Google সার্ভারের সাথে যোগাযোগ করতে পারে না তাই এটি PyPy.org সংগ্রহস্থল থেকে ইনস্টল করা ভাল।
এর জন্য আমাদের নিশ্চিত করতে হবে যে আমাদের পাইথন 3-পিপ প্যাকেজ ইনস্টল আছে এবং তারপর লিখুন:
sudo pip3 install gTTS
তারপরে আমরা নিম্নলিখিতগুলি করি:
sudo nano ~/.profile
এবং আমরা এই লাইন যোগ করি
export PATH="$HOME/.local/bin:$PATH"
আমরা সঙ্গে সংরক্ষণ করুন CTRL অথবা এবং আমরা সাথে রাখা সিটিআরএল এক্স
আমরা টাইপ করে উপলব্ধ ভাষা দেখতে পারি
gtts-cli --all
একটি টেক্সট ফাইল (এই ক্ষেত্রে mp3 তে) রূপান্তর করতে, আমরা করি:
gtts-cli -f prueba.txt --l es --output test.mp3
গুগল আমাদের প্রোগ্রামের ব্যবহারে সীমাবদ্ধতা রাখে, কিন্তু আমি এক ঘন্টা পর্যন্ত ফাইল তৈরি করতে সক্ষম হয়েছিলাম।