હાઇપરસ્ટાઇલ, ઇમેજ એડિટિંગ માટે સ્ટાઇલગનનું અનુકૂલન

ની એક ટીમ તેલ અવીવ યુનિવર્સિટીના સંશોધકોએ તાજેતરમાં હાઇપરસ્ટાઇલનું અનાવરણ કર્યું છે, જે છે વિપરીત સંસ્કરણ મશીન લર્નિંગ સિસ્ટમ NVIDIA StyleGAN2 જે વાસ્તવિક દુનિયાની છબીઓને સંપાદિત કરતી વખતે ગુમ થયેલ ટુકડાઓને ફરીથી બનાવવા માટે ફરીથી ડિઝાઇન કરવામાં આવી છે.

StyleGAN એ વાસ્તવિક દેખાવવાળા લોકોના નવા ચહેરાઓને સંશ્લેષણ કરવાની મંજૂરી દ્વારા વર્ગીકૃત થયેલ છે, ઉંમર, લિંગ, વાળની ​​લંબાઈ, સ્મિત પાત્ર, નાકનો આકાર, ત્વચાનો રંગ, ચશ્મા અને ફોટોગ્રાફિક એંગલ જેવા પરિમાણો સેટ કરવા.

બીજી તરફ, હાયપરસ્ટાઇલ હાલના પરિમાણોમાં સમાન પરિમાણો બદલવાનું શક્ય બનાવે છે, બીજા શબ્દોમાં કહીએ તો, તે તમને તેમની લાક્ષણિકતાઓમાં ફેરફાર કર્યા વિના અને મૂળ ચહેરાની ઓળખને સાચવ્યા વિના ફોટોગ્રાફ્સ બનાવવાની મંજૂરી આપે છે.

HyperStyle આપેલ ઇનપુટ ઇમેજની સાપેક્ષે અગાઉ પ્રશિક્ષિત સ્ટાઇલગેન જનરેટરના વજનને કેવી રીતે રિફાઇન કરવું તે શીખવા માટે હાઇપરનેટવર્કનો પરિચય આપે છે. આમ કરવાથી એન્કોડર-જેવા અનુમાન સમય અને ઉચ્ચ સંપાદનક્ષમતા સાથે ઓપ્ટિમાઇઝેશન સ્તર પુનઃનિર્માણને સક્ષમ કરે છે.

ઉદાહરણ તરીકે, ઉપયોગ કરતી વખતે હાઇપરસ્ટાઇલ, ફોટોગ્રાફમાં વ્યક્તિની ઉંમરમાં ફેરફારનું અનુકરણ કરી શકે છે, હેરસ્ટાઇલ બદલો, ચશ્મા, દાઢી અથવા મૂછો ઉમેરો, ચિત્રને કાર્ટૂન પાત્ર અથવા હાથથી દોરેલા ચિત્ર જેવું બનાવો, ઉદાસી અથવા ખુશ ચહેરાના અભિવ્યક્તિ બનાવો.

આ કિસ્સામાં, સિસ્ટમને ફક્ત લોકોના ચહેરા બદલવા માટે જ નહીં, પણ કોઈપણ ઑબ્જેક્ટ માટે પણ પ્રશિક્ષિત કરી શકાય છે ઉદાહરણ તરીકે, કારની છબીઓને સંપાદિત કરવા માટે.

વ્યુત્ક્રમનો અભ્યાસ કરતી મોટાભાગની કૃતિઓ સુપ્ત કોડ માટે જુએ છે જે આપેલ છબીને વધુ સચોટ રીતે પુનઃનિર્માણ કરે છે. કેટલાક તાજેતરના કાર્યમાં આપેલ લક્ષ્ય ઇમેજ માટે ઉચ્ચ ગુણવત્તાની પુનઃનિર્માણ પ્રાપ્ત કરવા માટે જનરેટરના વજનના ઇમેજ ફાઇન ટ્યુનિંગનો પ્રસ્તાવ મૂક્યો છે. HyperStyle સાથે, અમારો ધ્યેય આ જનરેટર ટ્યુનિંગ અભિગમોને એન્કોડર-આધારિત અભિગમમાં અનુકૂલન કરીને ઇન્ટરેક્ટિવ એપ્લિકેશન્સના ક્ષેત્રમાં લાવવાનો છે.

ઇચ્છિત લક્ષ્ય ઇમેજની તુલનામાં જનરેટરના વજનને કેવી રીતે રિફાઇન કરવું તે શીખવા માટે અમે સિંગલ હાઇપરનેટવર્કને તાલીમ આપી છે. આ મેપિંગ શીખીને, હાયપરસ્ટાઈલ પ્રતિ ઈમેજ 2 સેકન્ડથી ઓછા સમયમાં જનરેટરના લક્ષ્ય વજનની અસરકારક રીતે આગાહી કરે છે, જે તેને એપ્લિકેશનની વિશાળ શ્રેણી પર લાગુ કરી શકે છે.

સૂચિત પદ્ધતિ સંપાદન દરમિયાન ઇમેજના ગુમ થયેલા ભાગોને પુનઃનિર્માણ કરવાની સમસ્યાને હલ કરવાનો હેતુ છે. અગાઉ સૂચિત ટેકનિકોએ પુનઃનિર્માણ અને સંપાદન વચ્ચેના સંતુલનને સંબોધિત કર્યું છે અને લક્ષ્ય ઇમેજના ભાગોને બદલવા માટે ઇમેજરને ફાઇન-ટ્યુનિંગ કરીને સંપાદનયોગ્ય પ્રદેશોને ફરીથી બનાવ્યા છે જે મૂળરૂપે ખૂટે છે. આવા અભિગમોનું નુકસાન એ દરેક છબી માટે ન્યુરલ નેટવર્કની લાંબા ગાળાની લક્ષિત તાલીમની જરૂરિયાત છે.

StyleGAN અલ્ગોરિધમ પર આધારિત પદ્ધતિ લાક્ષણિક મોડેલનો ઉપયોગ કરવાની મંજૂરી આપે છે, સામાન્ય ઇમેજ કલેક્શન પર પૂર્વ પ્રશિક્ષિત, દરેક ઇમેજ માટે મૉડલની વ્યક્તિગત તાલીમની જરૂર હોય તેવા અલ્ગોરિધમ્સ સાથે તુલનાત્મક આત્મવિશ્વાસના સ્તર સાથે મૂળ છબીના લાક્ષણિક તત્વો પેદા કરવા.

નવી પદ્ધતિનો એક ફાયદો એ છે કે વાસ્તવિક સમયની નજીકના પ્રદર્શન સાથે છબીઓને સંશોધિત કરવાની ક્ષમતા, તે ઉપરાંત સંગ્રહના આધારે તે લોકો, કાર અને પ્રાણીઓ માટે તૈયાર કરવામાં આવેલી તાલીમ માટે મોડેલ તૈયાર છે Flickr-the Faces-HQ (FFHQ, લોકોના ચહેરાની 70,000 ઉચ્ચ-ગુણવત્તાવાળી PNG છબીઓ), ધ સ્ટેનફોર્ડ કાર્સ (કારની 16 છબીઓ) અને AFHQ (પ્રાણીઓની તસવીરો) માંથી.

ઉપરાંત, તમારા મોડલ્સને તાલીમ આપવા માટે સાધનોનો સમૂહ પ્રદાન કરવામાં આવે છેતેમજ સામાન્ય એન્કોડર્સ અને જનરેટરના ઉપયોગ માટે તૈયાર પ્રશિક્ષિત મોડલ્સ તેમની સાથે ઉપયોગ માટે યોગ્ય છે. ઉદાહરણ તરીકે, Toonify-શૈલીની છબીઓ બનાવવા, Pixar અક્ષરો બનાવવા, સ્કેચ બનાવવા અને ડિઝની રાજકુમારીઓ જેવી સ્ટાઇલ બનાવવા માટે જનરેટર ઉપલબ્ધ છે.

છેલ્લે વધુ જાણવામાં રસ ધરાવતા લોકો માટે આ સાધન વિશે, તમે વિગતો ચકાસી શકો છો નીચેની કડીમાં

એ ઉલ્લેખ કરવો પણ જરૂરી છે કે કોડ PyTorch ફ્રેમવર્કનો ઉપયોગ કરીને Python માં લખાયેલ છે અને MIT લાઇસન્સ પ્રાપ્ત છે. તમે પર કોડ ચકાસી શકો છો નીચેની કડી.


તમારી ટિપ્પણી મૂકો

તમારું ઇમેઇલ સરનામું પ્રકાશિત કરવામાં આવશે નહીં. આવશ્યક ક્ષેત્રો સાથે ચિહ્નિત થયેલ છે *

*

*

  1. ડેટા માટે જવાબદાર: AB ઈન્ટરનેટ નેટવર્ક્સ 2008 SL
  2. ડેટાનો હેતુ: નિયંત્રણ સ્પામ, ટિપ્પણી સંચાલન.
  3. કાયદો: તમારી સંમતિ
  4. ડેટાની વાતચીત: કાયદાકીય જવાબદારી સિવાય ડેટા તૃતીય પક્ષને આપવામાં આવશે નહીં.
  5. ડેટા સ્ટોરેજ: cસેન્ટસ નેટવર્ક્સ (ઇયુ) દ્વારા હોસ્ટ કરેલો ડેટાબેઝ
  6. અધિકાર: કોઈપણ સમયે તમે તમારી માહિતીને મર્યાદિત, પુન recoverપ્રાપ્ત અને કા deleteી શકો છો.