ಹೈಪರ್‌ಸ್ಟೈಲ್, ಇಮೇಜ್ ಎಡಿಟಿಂಗ್‌ಗಾಗಿ StyleGAN ನ ರೂಪಾಂತರ

ಒಂದು ತಂಡ ಟೆಲ್ ಅವಿವ್ ವಿಶ್ವವಿದ್ಯಾಲಯದ ಸಂಶೋಧಕರು ಇತ್ತೀಚೆಗೆ ಹೈಪರ್‌ಸ್ಟೈಲ್ ಅನ್ನು ಅನಾವರಣಗೊಳಿಸಿದ್ದಾರೆ, ಇದು ಒಂದು ಹಿಮ್ಮುಖ ಆವೃತ್ತಿ ಯಂತ್ರ ಕಲಿಕೆ ವ್ಯವಸ್ಥೆಯ NVIDIA StyleGAN2 ನೈಜ ಪ್ರಪಂಚದ ಚಿತ್ರಗಳನ್ನು ಸಂಪಾದಿಸುವಾಗ ಕಾಣೆಯಾದ ತುಣುಕುಗಳನ್ನು ಮರುಸೃಷ್ಟಿಸಲು ಮರುವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ.

ಸ್ಟೈಲ್‌ಗಾನ್ ವಾಸ್ತವಿಕ ನೋಟವನ್ನು ಹೊಂದಿರುವ ಜನರ ಹೊಸ ಮುಖಗಳನ್ನು ಸಂಶ್ಲೇಷಿಸಲು ಅನುಮತಿಸುವ ಮೂಲಕ ನಿರೂಪಿಸಲ್ಪಟ್ಟಿದೆ, ವಯಸ್ಸು, ಲಿಂಗ, ಕೂದಲಿನ ಉದ್ದ, ನಗು ಪಾತ್ರ, ಮೂಗಿನ ಆಕಾರ, ಚರ್ಮದ ಬಣ್ಣ, ಕನ್ನಡಕ ಮತ್ತು ಛಾಯಾಗ್ರಹಣದ ಕೋನದಂತಹ ನಿಯತಾಂಕಗಳನ್ನು ಹೊಂದಿಸುವುದು.

ಮತ್ತೊಂದೆಡೆ, ಹೈಪರ್‌ಸ್ಟೈಲ್ ಅಸ್ತಿತ್ವದಲ್ಲಿರುವ ಪ್ಯಾರಾಮೀಟರ್‌ಗಳಲ್ಲಿ ಒಂದೇ ರೀತಿಯ ನಿಯತಾಂಕಗಳನ್ನು ಬದಲಾಯಿಸಲು ಸಾಧ್ಯವಾಗಿಸುತ್ತದೆ, ಬೇರೆ ರೀತಿಯಲ್ಲಿ ಹೇಳುವುದಾದರೆ, ಛಾಯಾಚಿತ್ರಗಳನ್ನು ಅವುಗಳ ವಿಶಿಷ್ಟ ಲಕ್ಷಣಗಳನ್ನು ಮಾರ್ಪಡಿಸದೆ ಮತ್ತು ಮೂಲ ಮುಖದ ಗುರುತಿಸುವಿಕೆಯನ್ನು ಸಂರಕ್ಷಿಸದೆಯೇ ರಚಿಸಲು ಅನುಮತಿಸುತ್ತದೆ.

ನೀಡಿರುವ ಇನ್‌ಪುಟ್ ಇಮೇಜ್‌ಗೆ ಸಂಬಂಧಿಸಿದಂತೆ ಹಿಂದೆ ತರಬೇತಿ ಪಡೆದ StyleGAN ಜನರೇಟರ್‌ನ ತೂಕವನ್ನು ಹೇಗೆ ಸಂಸ್ಕರಿಸುವುದು ಎಂಬುದನ್ನು ತಿಳಿಯಲು ಹೈಪರ್‌ಸ್ಟೈಲ್ ಹೈಪರ್‌ನೆಟ್‌ವರ್ಕ್‌ಗಳನ್ನು ಪರಿಚಯಿಸುತ್ತದೆ. ಹಾಗೆ ಮಾಡುವುದರಿಂದ ಎನ್‌ಕೋಡರ್ ತರಹದ ನಿರ್ಣಯ ಸಮಯಗಳು ಮತ್ತು ಹೆಚ್ಚಿನ ಸಂಪಾದನೆಯೊಂದಿಗೆ ಆಪ್ಟಿಮೈಸೇಶನ್ ಮಟ್ಟದ ಮರುನಿರ್ಮಾಣವನ್ನು ಸಕ್ರಿಯಗೊಳಿಸುತ್ತದೆ.

ಉದಾಹರಣೆಗೆ, ಬಳಸುವಾಗ ಹೈಪರ್‌ಸ್ಟೈಲ್, ಛಾಯಾಚಿತ್ರದಲ್ಲಿ ವ್ಯಕ್ತಿಯ ವಯಸ್ಸಿನ ಬದಲಾವಣೆಯನ್ನು ಅನುಕರಿಸಬಹುದು, ಕೇಶವಿನ್ಯಾಸವನ್ನು ಬದಲಾಯಿಸಿ, ಕನ್ನಡಕ, ಗಡ್ಡ ಅಥವಾ ಮೀಸೆ ಸೇರಿಸಿ, ಚಿತ್ರವನ್ನು ಕಾರ್ಟೂನ್ ಪಾತ್ರ ಅಥವಾ ಕೈಯಿಂದ ಚಿತ್ರಿಸಿದ ಚಿತ್ರದಂತೆ ಕಾಣುವಂತೆ ಮಾಡಿ, ದುಃಖ ಅಥವಾ ಸಂತೋಷದ ಮುಖವನ್ನು ವ್ಯಕ್ತಪಡಿಸಿ.

ಈ ಸಂದರ್ಭದಲ್ಲಿ, ವ್ಯವಸ್ಥೆಯು ಜನರ ಮುಖಗಳನ್ನು ಬದಲಾಯಿಸಲು ಮಾತ್ರವಲ್ಲದೆ ಯಾವುದೇ ವಸ್ತುವಿಗಾಗಿ ತರಬೇತಿ ನೀಡಬಹುದು ಉದಾಹರಣೆಗೆ, ಕಾರ್ ಚಿತ್ರಗಳನ್ನು ಸಂಪಾದಿಸಲು.

ವಿಲೋಮವನ್ನು ಅಧ್ಯಯನ ಮಾಡುವ ಹೆಚ್ಚಿನ ಕೃತಿಗಳು ಸುಪ್ತ ಸಂಕೇತವನ್ನು ಹುಡುಕುತ್ತವೆ, ಅದು ನೀಡಿದ ಚಿತ್ರವನ್ನು ಹೆಚ್ಚು ನಿಖರವಾಗಿ ಪುನರ್ನಿರ್ಮಿಸುತ್ತದೆ. ಕೆಲವು ಇತ್ತೀಚಿನ ಕೆಲಸಗಳು ನಿರ್ದಿಷ್ಟ ಗುರಿಯ ಚಿತ್ರಕ್ಕಾಗಿ ಉತ್ತಮ ಗುಣಮಟ್ಟದ ಪುನರ್ನಿರ್ಮಾಣವನ್ನು ಸಾಧಿಸಲು ಜನರೇಟರ್ ತೂಕದ ಇಮೇಜ್ ಫೈನ್ ಟ್ಯೂನಿಂಗ್ ಅನ್ನು ಪ್ರಸ್ತಾಪಿಸಿದೆ. ಹೈಪರ್‌ಸ್ಟೈಲ್‌ನೊಂದಿಗೆ, ಈ ಜನರೇಟರ್ ಟ್ಯೂನಿಂಗ್ ವಿಧಾನಗಳನ್ನು ಎನ್‌ಕೋಡರ್ ಆಧಾರಿತ ವಿಧಾನಕ್ಕೆ ಅಳವಡಿಸಿಕೊಳ್ಳುವ ಮೂಲಕ ಸಂವಾದಾತ್ಮಕ ಅಪ್ಲಿಕೇಶನ್‌ಗಳ ಕ್ಷೇತ್ರಕ್ಕೆ ತರುವುದು ನಮ್ಮ ಗುರಿಯಾಗಿದೆ.

ಅಪೇಕ್ಷಿತ ಗುರಿ ಚಿತ್ರಕ್ಕೆ ಸಂಬಂಧಿಸಿದಂತೆ ಜನರೇಟರ್ ತೂಕವನ್ನು ಹೇಗೆ ಪರಿಷ್ಕರಿಸುವುದು ಎಂಬುದನ್ನು ತಿಳಿಯಲು ನಾವು ಒಂದೇ ಹೈಪರ್‌ನೆಟ್‌ವರ್ಕ್ ಅನ್ನು ತರಬೇತಿ ಮಾಡಿದ್ದೇವೆ. ಈ ಮ್ಯಾಪಿಂಗ್ ಅನ್ನು ಕಲಿಯುವ ಮೂಲಕ, ಹೈಪರ್‌ಸ್ಟೈಲ್ ಪ್ರತಿ ಚಿತ್ರಕ್ಕೆ 2 ಸೆಕೆಂಡುಗಳಿಗಿಂತ ಕಡಿಮೆ ಅವಧಿಯಲ್ಲಿ ಜನರೇಟರ್ ಗುರಿ ತೂಕವನ್ನು ಸಮರ್ಥವಾಗಿ ಊಹಿಸುತ್ತದೆ, ಇದು ವ್ಯಾಪಕ ಶ್ರೇಣಿಯ ಅಪ್ಲಿಕೇಶನ್‌ಗಳಿಗೆ ಅನ್ವಯಿಸುತ್ತದೆ.

ಉದ್ದೇಶಿತ ವಿಧಾನ ಸಂಪಾದನೆಯ ಸಮಯದಲ್ಲಿ ಚಿತ್ರದ ಕಾಣೆಯಾದ ಭಾಗಗಳನ್ನು ಪುನರ್ನಿರ್ಮಿಸುವ ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸುವ ಗುರಿಯನ್ನು ಹೊಂದಿದೆ. ಹಿಂದೆ ಪ್ರಸ್ತಾಪಿಸಲಾದ ತಂತ್ರಗಳು ಮೂಲತಃ ಕಾಣೆಯಾಗಿರುವ ಸಂಪಾದಿಸಬಹುದಾದ ಪ್ರದೇಶಗಳನ್ನು ಮರುಸೃಷ್ಟಿಸುವಾಗ ಗುರಿಯ ಚಿತ್ರದ ಭಾಗಗಳನ್ನು ಬದಲಿಸಲು ಇಮೇಜರ್ ಅನ್ನು ಸೂಕ್ಷ್ಮವಾಗಿ ಟ್ಯೂನ್ ಮಾಡುವ ಮೂಲಕ ಪುನರ್ನಿರ್ಮಾಣ ಮತ್ತು ಸಂಪಾದನೆಯ ನಡುವಿನ ಸಮತೋಲನವನ್ನು ತಿಳಿಸಲಾಗಿದೆ. ಅಂತಹ ವಿಧಾನಗಳ ತೊಂದರೆಯು ಪ್ರತಿ ಚಿತ್ರಕ್ಕಾಗಿ ನರಮಂಡಲದ ದೀರ್ಘಕಾಲೀನ ಗುರಿಯ ತರಬೇತಿಯ ಅಗತ್ಯವಾಗಿದೆ.

StyleGAN ಅಲ್ಗಾರಿದಮ್ ಅನ್ನು ಆಧರಿಸಿದ ವಿಧಾನವು ವಿಶಿಷ್ಟ ಮಾದರಿಯನ್ನು ಬಳಸಲು ಅನುಮತಿಸುತ್ತದೆ, ಪ್ರತಿ ಚಿತ್ರಕ್ಕೆ ಮಾದರಿಯ ವೈಯಕ್ತಿಕ ತರಬೇತಿ ಅಗತ್ಯವಿರುವ ಅಲ್ಗಾರಿದಮ್‌ಗಳಿಗೆ ಹೋಲಿಸಬಹುದಾದ ವಿಶ್ವಾಸಾರ್ಹತೆಯ ಮಟ್ಟವನ್ನು ಹೊಂದಿರುವ ಮೂಲ ಚಿತ್ರದ ವಿಶಿಷ್ಟ ಅಂಶಗಳನ್ನು ರಚಿಸಲು ಸಾಮಾನ್ಯ ಚಿತ್ರ ಸಂಗ್ರಹಗಳಲ್ಲಿ ಪೂರ್ವ ತರಬೇತಿ ನೀಡಲಾಗಿದೆ.

ಹೊಸ ವಿಧಾನದ ಒಂದು ಪ್ರಯೋಜನವೆಂದರೆ ನೈಜ ಸಮಯಕ್ಕೆ ಹತ್ತಿರವಿರುವ ಕಾರ್ಯಕ್ಷಮತೆಯೊಂದಿಗೆ ಚಿತ್ರಗಳನ್ನು ಮಾರ್ಪಡಿಸುವ ಸಾಮರ್ಥ್ಯ, ಇದರ ಜೊತೆಗೆ ಸಂಗ್ರಹಣೆಗಳ ಆಧಾರದ ಮೇಲೆ ಆ ಜನರು, ಕಾರುಗಳು ಮತ್ತು ಪ್ರಾಣಿಗಳಿಗೆ ತರಬೇತಿ ನೀಡಲು ಮಾದರಿಯು ಸಿದ್ಧವಾಗಿದೆ Flickr-the Faces-HQ (FFHQ, ಜನರ ಮುಖಗಳ 70,000 ಉನ್ನತ-ಗುಣಮಟ್ಟದ PNG ಚಿತ್ರಗಳು), ದಿ ಸ್ಟ್ಯಾನ್‌ಫೋರ್ಡ್ ಕಾರ್ಸ್ (16 ಕಾರುಗಳ ಚಿತ್ರಗಳು) ಮತ್ತು AFHQ (ಪ್ರಾಣಿಗಳ ಫೋಟೋಗಳು) ನಿಂದ.

ಸಹ, ನಿಮ್ಮ ಮಾದರಿಗಳಿಗೆ ತರಬೇತಿ ನೀಡಲು ಉಪಕರಣಗಳ ಗುಂಪನ್ನು ಒದಗಿಸಲಾಗಿದೆಹಾಗೆಯೇ ಅವುಗಳನ್ನು ಬಳಸಲು ಸೂಕ್ತವಾದ ವಿಶಿಷ್ಟ ಎನ್‌ಕೋಡರ್‌ಗಳು ಮತ್ತು ಜನರೇಟರ್‌ಗಳ ಬಳಸಲು ಸಿದ್ಧವಾದ ತರಬೇತಿ ಮಾದರಿಗಳು. ಉದಾಹರಣೆಗೆ, ಟೂನಿಫೈ-ಶೈಲಿಯ ಚಿತ್ರಗಳು, ಪಿಕ್ಸರ್ ಪಾತ್ರಗಳು, ರೇಖಾಚಿತ್ರಗಳನ್ನು ರಚಿಸುವುದು ಮತ್ತು ಡಿಸ್ನಿ ರಾಜಕುಮಾರಿಯರಂತೆ ಸ್ಟೈಲಿಂಗ್ ಮಾಡಲು ಜನರೇಟರ್‌ಗಳು ಲಭ್ಯವಿವೆ.

ಅಂತಿಮವಾಗಿ ಇನ್ನಷ್ಟು ತಿಳಿದುಕೊಳ್ಳಲು ಆಸಕ್ತಿ ಇರುವವರಿಗೆ ಈ ಉಪಕರಣದ ಬಗ್ಗೆ, ನೀವು ವಿವರಗಳನ್ನು ಪರಿಶೀಲಿಸಬಹುದು ಕೆಳಗಿನ ಲಿಂಕ್‌ನಲ್ಲಿ.

PyTorch ಫ್ರೇಮ್‌ವರ್ಕ್ ಅನ್ನು ಬಳಸಿಕೊಂಡು ಪೈಥಾನ್‌ನಲ್ಲಿ ಕೋಡ್ ಅನ್ನು ಬರೆಯಲಾಗಿದೆ ಮತ್ತು MIT ಪರವಾನಗಿ ಹೊಂದಿದೆ ಎಂಬುದನ್ನು ನಮೂದಿಸುವುದು ಮುಖ್ಯವಾಗಿದೆ. ನೀವು ಕೋಡ್ ಅನ್ನು ಇಲ್ಲಿ ಪರಿಶೀಲಿಸಬಹುದು ಕೆಳಗಿನ ಲಿಂಕ್.


ನಿಮ್ಮ ಅಭಿಪ್ರಾಯವನ್ನು ಬಿಡಿ

ನಿಮ್ಮ ಈಮೇಲ್ ವಿಳಾಸ ಪ್ರಕಟವಾದ ಆಗುವುದಿಲ್ಲ. ಅಗತ್ಯವಿರುವ ಜಾಗ ಗುರುತಿಸಲಾಗಿದೆ *

*

*

  1. ಡೇಟಾಗೆ ಜವಾಬ್ದಾರಿ: AB ಇಂಟರ್ನೆಟ್ ನೆಟ್ವರ್ಕ್ಸ್ 2008 SL
  2. ಡೇಟಾದ ಉದ್ದೇಶ: ನಿಯಂತ್ರಣ SPAM, ಕಾಮೆಂಟ್ ನಿರ್ವಹಣೆ.
  3. ಕಾನೂನುಬದ್ಧತೆ: ನಿಮ್ಮ ಒಪ್ಪಿಗೆ
  4. ಡೇಟಾದ ಸಂವಹನ: ಕಾನೂನುಬದ್ಧ ಬಾಧ್ಯತೆಯನ್ನು ಹೊರತುಪಡಿಸಿ ಡೇಟಾವನ್ನು ಮೂರನೇ ವ್ಯಕ್ತಿಗಳಿಗೆ ಸಂವಹನ ಮಾಡಲಾಗುವುದಿಲ್ಲ.
  5. ಡೇಟಾ ಸಂಗ್ರಹಣೆ: ಆಕ್ಸೆಂಟಸ್ ನೆಟ್‌ವರ್ಕ್‌ಗಳು (ಇಯು) ಹೋಸ್ಟ್ ಮಾಡಿದ ಡೇಟಾಬೇಸ್
  6. ಹಕ್ಕುಗಳು: ಯಾವುದೇ ಸಮಯದಲ್ಲಿ ನೀವು ನಿಮ್ಮ ಮಾಹಿತಿಯನ್ನು ಮಿತಿಗೊಳಿಸಬಹುದು, ಮರುಪಡೆಯಬಹುದು ಮತ್ತು ಅಳಿಸಬಹುದು.