হাইপারস্টাইল, চিত্র সম্পাদনার জন্য স্টাইলগানের একটি অভিযোজন

একটি দল তেল আবিব বিশ্ববিদ্যালয়ের গবেষকরা সম্প্রতি হাইপারস্টাইল উন্মোচন করেছেন, যা হলো একটি বিপরীত সংস্করণ মেশিন লার্নিং সিস্টেমের NVIDIA StyleGAN2 বাস্তব বিশ্বের চিত্র সম্পাদনা করার সময় অনুপস্থিত টুকরা পুনরায় তৈরি করার জন্য যা পুনরায় ডিজাইন করা হয়েছে৷

StyleGAN একটি বাস্তবসম্মত চেহারা সঙ্গে মানুষের নতুন মুখ সংশ্লেষ করার অনুমতি দ্বারা চিহ্নিত করা হয়, বয়স, লিঙ্গ, চুলের দৈর্ঘ্য, হাসির চরিত্র, নাকের আকৃতি, ত্বকের রঙ, চশমা এবং ফটোগ্রাফিক অ্যাঙ্গেলের মতো প্যারামিটার সেট করা।

অন্যদিকে, হাইপারস্টাইল বিদ্যমানগুলির মধ্যে অনুরূপ পরামিতিগুলি পরিবর্তন করা সম্ভব করে তোলে, অন্য কথায়, এটি আপনাকে তাদের চারিত্রিক বৈশিষ্ট্যগুলি পরিবর্তন না করে এবং আসল মুখের স্বীকৃতি সংরক্ষণ না করে ফটোগ্রাফ তৈরি করতে দেয়।

হাইপার স্টাইল একটি প্রদত্ত ইনপুট চিত্রের সাথে সম্পর্কিত একটি পূর্বে প্রশিক্ষিত স্টাইলগান জেনারেটরের ওজন কীভাবে পরিমার্জন করতে হয় তা শিখতে হাইপারনেটওয়ার্কের প্রবর্তন করে। এটি করার ফলে এনকোডারের মতো অনুমান সময় এবং উচ্চ সম্পাদনাযোগ্যতার সাথে অপ্টিমাইজেশান স্তর পুনর্নির্মাণ সক্ষম হয়।

উদাহরণস্বরূপ, ব্যবহার করার সময় হাইপারস্টাইল, ফটোগ্রাফে একজন ব্যক্তির বয়সের পরিবর্তন অনুকরণ করতে পারে, একটি চুলের স্টাইল পরিবর্তন করুন, চশমা, দাড়ি বা গোঁফ যোগ করুন, একটি ছবিকে একটি কার্টুন চরিত্র বা হাতে আঁকা ছবির মতো দেখান, একটি দুঃখজনক বা সুখী মুখের অভিব্যক্তি তৈরি করুন।

এই ক্ষেত্রে, সিস্টেম শুধুমাত্র মানুষের মুখ পরিবর্তন করার জন্য প্রশিক্ষিত হতে পারে, কিন্তু যে কোনো বস্তুর জন্য, জন্য উদাহরণস্বরূপ, গাড়ির ছবি সম্পাদনা করতে।

ইনভার্সন অধ্যয়ন করে এমন বেশিরভাগ কাজ একটি সুপ্ত কোডের সন্ধান করে যা একটি প্রদত্ত চিত্রকে আরও সঠিকভাবে পুনর্গঠন করে। কিছু সাম্প্রতিক কাজ একটি প্রদত্ত লক্ষ্য চিত্রের জন্য একটি উচ্চ মানের পুনর্গঠন অর্জনের জন্য জেনারেটরের ওজনের ইমেজ ফাইন টিউনিংয়ের প্রস্তাব করেছে। হাইপারস্টাইলের সাথে, আমরা এই জেনারেটর টিউনিং পদ্ধতিগুলিকে একটি এনকোডার-ভিত্তিক পদ্ধতিতে অভিযোজিত করে ইন্টারেক্টিভ অ্যাপ্লিকেশনগুলির ক্ষেত্রে নিয়ে আসার লক্ষ্য রাখি।

আমরা একটি একক হাইপারনেটওয়ার্ককে প্রশিক্ষণ দিয়েছি কিভাবে একটি কাঙ্ক্ষিত লক্ষ্য চিত্রের তুলনায় জেনারেটরের ওজন পরিমার্জন করতে হয়। এই ম্যাপিং শেখার মাধ্যমে, হাইপারস্টাইল দক্ষতার সাথে জেনারেটরের টার্গেট ওজন প্রতি ইমেজ 2 সেকেন্ডেরও কম সময়ে ভবিষ্যদ্বাণী করে, এটিকে বিভিন্ন অ্যাপ্লিকেশনের জন্য প্রযোজ্য করে তোলে।

প্রস্তাবিত পদ্ধতি সম্পাদনার সময় একটি চিত্রের অনুপস্থিত অংশ পুনর্গঠনের সমস্যা সমাধানের লক্ষ্য. উপরে প্রস্তাবিত কৌশলগুলি পুনর্গঠন এবং সম্পাদনার মধ্যে ভারসাম্য বজায় রাখার জন্য ইমেজারকে সূক্ষ্ম-টিউনিং করে লক্ষ্য চিত্রের অংশগুলি প্রতিস্থাপন করার সময় সম্পাদনাযোগ্য অঞ্চলগুলিকে পুনরায় তৈরি করে যা মূলত অনুপস্থিত ছিল। এই ধরনের পন্থাগুলির নেতিবাচক দিক হল প্রতিটি চিত্রের জন্য নিউরাল নেটওয়ার্কের দীর্ঘমেয়াদী লক্ষ্যযুক্ত প্রশিক্ষণের প্রয়োজন।

StyleGAN অ্যালগরিদমের উপর ভিত্তি করে পদ্ধতিটি একটি সাধারণ মডেল ব্যবহার করতে দেয়, প্রতিটি চিত্রের জন্য মডেলের একটি পৃথক প্রশিক্ষণের প্রয়োজন এমন অ্যালগরিদমের সাথে তুলনীয় আত্মবিশ্বাসের স্তরের সাথে আসল চিত্রের বৈশিষ্ট্যযুক্ত উপাদানগুলি তৈরি করার জন্য চিত্রগুলির সাধারণ সংগ্রহগুলিতে পূর্বপ্রশিক্ষিত।

নতুন পদ্ধতির সুবিধাগুলির মধ্যে একটি হল বাস্তব সময়ের কাছাকাছি পারফরম্যান্স সহ চিত্রগুলিকে সংশোধন করার ক্ষমতা, তা ছাড়াও মডেল সংগ্রহের উপর ভিত্তি করে যারা মানুষ, গাড়ি এবং পশুদের জন্য প্রস্তুত প্রশিক্ষণের জন্য প্রস্তুত Flickr-the Faces-HQ (FFHQ, মানুষের মুখের 70,000 উচ্চ-মানের PNG ছবি), দ্য স্ট্যানফোর্ড কার (গাড়ির 16 ছবি) এবং AFHQ (প্রাণীর ছবি) থেকে।

উপরন্তু, আপনার মডেলগুলিকে প্রশিক্ষণ দেওয়ার জন্য সরঞ্জামগুলির একটি সেট সরবরাহ করা হয়েছেপাশাপাশি সাধারণ এনকোডার এবং তাদের সাথে ব্যবহারের জন্য উপযুক্ত জেনারেটরের প্রস্তুত প্রশিক্ষিত মডেল। উদাহরণস্বরূপ, টুনিফাই-স্টাইলের ছবি, পিক্সার অক্ষর, স্কেচ তৈরি এবং এমনকি ডিজনি রাজকুমারীর মতো স্টাইল করার জন্য জেনারেটর উপলব্ধ রয়েছে।

পরিশেষে যারা আরো জানতে আগ্রহী তাদের জন্য এই টুল সম্পর্কে, আপনি বিস্তারিত চেক করতে পারেন নীচের লিঙ্কে।

এটি উল্লেখ করাও গুরুত্বপূর্ণ যে কোডটি PyTorch ফ্রেমওয়ার্ক ব্যবহার করে পাইথনে লেখা হয়েছে এবং এটি MIT লাইসেন্সপ্রাপ্ত। আপনি কোড চেক করতে পারেন নিম্নলিখিত লিঙ্ক।


আপনার মন্তব্য দিন

আপনার ইমেল ঠিকানা প্রকাশিত হবে না। প্রয়োজনীয় ক্ষেত্রগুলি দিয়ে চিহ্নিত করা *

*

*

  1. ডেটার জন্য দায়ী: AB ইন্টারনেট নেটওয়ার্ক 2008 SL
  2. ডেটার উদ্দেশ্য: নিয়ন্ত্রণ স্প্যাম, মন্তব্য পরিচালনা।
  3. আইনীকরণ: আপনার সম্মতি
  4. তথ্য যোগাযোগ: ডেটা আইনি বাধ্যবাধকতা ব্যতীত তৃতীয় পক্ষের কাছে জানানো হবে না।
  5. ডেটা স্টোরেজ: ওসেন্টাস নেটওয়ার্কস (ইইউ) দ্বারা হোস্ট করা ডেটাবেস
  6. অধিকার: যে কোনও সময় আপনি আপনার তথ্য সীমাবদ্ধ করতে, পুনরুদ্ধার করতে এবং মুছতে পারেন।