ಸ್ಟೈಲ್ ಜಿಎಎನ್ 3, ಮುಖ ಸಂಶ್ಲೇಷಣೆಗಾಗಿ ಎನ್ವಿಡಿಯ ಯಂತ್ರ ಕಲಿಕಾ ವ್ಯವಸ್ಥೆ

ಇತ್ತೀಚೆಗೆ NVIDIA StyleGAN3 ಗಾಗಿ ಮೂಲ ಕೋಡ್ ಅನ್ನು ಬಿಡುಗಡೆ ಮಾಡಿದೆ, ಮಾನವ ಮುಖಗಳ ವಾಸ್ತವಿಕ ಚಿತ್ರಗಳನ್ನು ಸಂಶ್ಲೇಷಿಸಲು ಉತ್ಪಾದಕ ಪ್ರತಿಕೂಲ ನರ ಜಾಲಗಳನ್ನು (GAN) ಆಧರಿಸಿದ ಯಂತ್ರ ಕಲಿಕಾ ವ್ಯವಸ್ಥೆ.

GAN3 ಶೈಲಿಯಲ್ಲಿ ಸಂಗ್ರಹಣೆಯಲ್ಲಿ ತರಬೇತಿ ಪಡೆದ ತರಬೇತಿ ಪಡೆದ ಮಾದರಿಗಳನ್ನು ಡೌನ್‌ಲೋಡ್ ಮಾಡಲು ಲಭ್ಯವಿದೆ Flickr-Faces-HQ (FFHQ), ಇದು ಉನ್ನತ ಗುಣಮಟ್ಟದ ಮಾನವ ಮುಖಗಳ 70 ಸಾವಿರ PNG ಚಿತ್ರಗಳನ್ನು ಒಳಗೊಂಡಿದೆ (1024 × 1024). ಇದರ ಜೊತೆಗೆ, AFHQv2 (ಪ್ರಾಣಿಗಳ ಮುಖಗಳ ಛಾಯಾಚಿತ್ರಗಳು) ಮತ್ತು ಮೆಟ್‌ಫೇಸ್‌ಗಳು (ಶಾಸ್ತ್ರೀಯ ಚಿತ್ರಕಲೆ ಭಾವಚಿತ್ರಗಳಿಂದ ಜನರ ಮುಖದ ಚಿತ್ರಗಳು) ಸಂಗ್ರಹಗಳ ಆಧಾರದ ಮೇಲೆ ನಿರ್ಮಿಸಲಾದ ಮಾದರಿಗಳಿವೆ.

StyleGAN3 ಕುರಿತು

ವಿನ್ಯಾಸ ಮುಖಗಳ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸುತ್ತದೆ, ಆದರೆ ಯಾವುದೇ ರೀತಿಯ ವಸ್ತುವನ್ನು ಉತ್ಪಾದಿಸಲು ವ್ಯವಸ್ಥೆಯನ್ನು ತರಬೇತಿ ಮಾಡಬಹುದು, ಭೂದೃಶ್ಯಗಳು ಮತ್ತು ಕಾರುಗಳಂತೆ. ಮತ್ತೆ ಇನ್ನು ಏನು, ನರ ಜಾಲದ ಸ್ವಯಂ ಕಲಿಕೆಗಾಗಿ ಉಪಕರಣಗಳನ್ನು ಒದಗಿಸಲಾಗಿದೆ ನಿಮ್ಮ ಸ್ವಂತ ಚಿತ್ರ ಸಂಗ್ರಹಗಳನ್ನು ಬಳಸಿ. ಒಂದು ಅಥವಾ ಹೆಚ್ಚಿನ NVIDIA ಗ್ರಾಫಿಕ್ಸ್ ಕಾರ್ಡ್‌ಗಳ ಅಗತ್ಯವಿದೆ (ಟೆಸ್ಲಾ V100 ಅಥವಾ A100 GPU ಗಳನ್ನು ಶಿಫಾರಸು ಮಾಡಲಾಗಿದೆ), ಕನಿಷ್ಠ 12GB RAM, PyTorch 1.9, ಮತ್ತು CUDA 11.1+ Toolkit. ಸ್ವೀಕರಿಸಿದ ಮುಖಗಳ ಕೃತಕ ಸ್ವಭಾವವನ್ನು ನಿರ್ಧರಿಸಲು, ವಿಶೇಷ ಶೋಧಕವನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಲಾಗುತ್ತಿದೆ.

ವ್ಯವಸ್ಥೆ ಹಲವಾರು ಮುಖಗಳ ವೈಶಿಷ್ಟ್ಯಗಳ ಮಧ್ಯಸ್ಥಿಕೆಯ ಆಧಾರದ ಮೇಲೆ ಹೊಸ ಮುಖದ ಚಿತ್ರವನ್ನು ಸಂಶ್ಲೇಷಿಸಲು ಅನುಮತಿಸುತ್ತದೆ, ಅವರ ಅಂತರ್ಗತ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಸಂಯೋಜಿಸಿ, ಅಂತಿಮ ಚಿತ್ರವನ್ನು ಅಗತ್ಯ ವಯಸ್ಸು, ಲಿಂಗ, ಕೂದಲಿನ ಉದ್ದ, ಸ್ಮೈಲ್ ಪಾತ್ರ, ಮೂಗಿನ ಆಕಾರ, ಚರ್ಮದ ಬಣ್ಣ, ಕನ್ನಡಕ, ಛಾಯಾಚಿತ್ರದ ಕೋನಕ್ಕೆ ಅಳವಡಿಸಿಕೊಳ್ಳುವುದರ ಜೊತೆಗೆ.

ಜನರೇಟರ್ ಚಿತ್ರವನ್ನು ಶೈಲಿಗಳ ಸಂಗ್ರಹವಾಗಿ ಪರಿಗಣಿಸುತ್ತದೆ, ವಿಶಿಷ್ಟ ವಿವರಗಳನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಪ್ರತ್ಯೇಕಿಸುತ್ತದೆ (ನಸುಕಂದು, ಕೂದಲು, ಕನ್ನಡಕ) ಸಾಮಾನ್ಯ ಉನ್ನತ ಮಟ್ಟದ ಗುಣಲಕ್ಷಣಗಳು (ಭಂಗಿ, ಲಿಂಗ, ವಯಸ್ಸಿಗೆ ಸಂಬಂಧಿಸಿದ ಬದಲಾವಣೆಗಳು) ಮತ್ತು ಅವುಗಳನ್ನು ತೂಕದ ಅಂಶಗಳ ಮೂಲಕ ಪ್ರಾಬಲ್ಯದ ಗುಣಲಕ್ಷಣಗಳ ವ್ಯಾಖ್ಯಾನದೊಂದಿಗೆ ನಿರಂಕುಶವಾಗಿ ಸಂಯೋಜಿಸಲು ಅನುವು ಮಾಡಿಕೊಡುತ್ತದೆ ಮತ್ತು ಇದರ ಪರಿಣಾಮವಾಗಿ ಚಿತ್ರಗಳನ್ನು ರಚಿಸಲಾಗಿದೆ ನಿಜವಾದ ಛಾಯಾಚಿತ್ರಗಳಿಂದ ಸ್ಪಷ್ಟವಾಗಿ ಗುರುತಿಸಲಾಗುವುದಿಲ್ಲ.

ಸ್ಟೈಲ್‌ಗ್ಯಾನ್ ತಂತ್ರಜ್ಞಾನದ ಮೊದಲ ಆವೃತ್ತಿ (2019 ರಲ್ಲಿ ಬಿಡುಗಡೆಯಾಯಿತು), ನಂತರ 2 ರಲ್ಲಿ ಸ್ಟೈಲ್‌ಗಾನ್ 2020 ರ ಸುಧಾರಿತ ಆವೃತ್ತಿ, ಇದು ಚಿತ್ರದ ಗುಣಮಟ್ಟವನ್ನು ಸುಧಾರಿಸುತ್ತದೆ ಮತ್ತು ಕೆಲವು ಕಲಾಕೃತಿಗಳನ್ನು ತೆಗೆದುಹಾಕುತ್ತದೆ. ಅದೇ ಸಮಯದಲ್ಲಿ, ವ್ಯವಸ್ಥೆಯು ಸ್ಥಿರವಾಗಿತ್ತು, ಅಂದರೆ, ಇದು ವಾಸ್ತವಿಕ ಅನಿಮೇಷನ್ ಅಥವಾ ಮುಖದ ಚಲನೆಯನ್ನು ಅನುಮತಿಸಲಿಲ್ಲ. StyleGAN3 ಅನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸುವಾಗ, ಅನಿಮೇಷನ್ ಮತ್ತು ವಿಡಿಯೋದಲ್ಲಿ ಬಳಕೆಗೆ ತಂತ್ರಜ್ಞಾನವನ್ನು ಅಳವಡಿಸಿಕೊಳ್ಳುವುದು ಮುಖ್ಯ ಗುರಿಯಾಗಿತ್ತು.

StyleGAN3 ಮರುವಿನ್ಯಾಸಗೊಳಿಸಿದ ನಾನ್-ಅಲಿಯಾಸಿಂಗ್ ಇಮೇಜಿಂಗ್ ಆರ್ಕಿಟೆಕ್ಚರ್ ಅನ್ನು ಬಳಸುತ್ತದೆay ಹೊಸ ನರ ಜಾಲದ ತರಬೇತಿ ಸನ್ನಿವೇಶಗಳನ್ನು ನೀಡುತ್ತದೆ ಮತ್ತು ಸಂವಾದಾತ್ಮಕ ದೃಶ್ಯೀಕರಣ (ದೃಶ್ಯೀಕರಣ.ಪಿಪಿ), ವಿಶ್ಲೇಷಣೆ (avg_spectra.py) ಮತ್ತು ವೀಡಿಯೊ ಉತ್ಪಾದನೆ (gen_video.py) ಗಾಗಿ ಹೊಸ ಉಪಯುಕ್ತತೆಗಳನ್ನು ಒಳಗೊಂಡಿದೆ. ಅನುಷ್ಠಾನವು ಮೆಮೊರಿ ಬಳಕೆಯನ್ನು ಕಡಿಮೆ ಮಾಡುತ್ತದೆ ಮತ್ತು ಕಲಿಕೆಯ ಪ್ರಕ್ರಿಯೆಯನ್ನು ವೇಗಗೊಳಿಸುತ್ತದೆ.

StyleGAN3 ಆರ್ಕಿಟೆಕ್ಚರ್‌ನ ಒಂದು ಪ್ರಮುಖ ಲಕ್ಷಣವೆಂದರೆ ನರ ಜಾಲದಲ್ಲಿನ ಎಲ್ಲಾ ಸಿಗ್ನಲ್‌ಗಳ ವ್ಯಾಖ್ಯಾನಕ್ಕೆ ನಿರಂತರ ಪ್ರಕ್ರಿಯೆಗಳ ರೂಪದಲ್ಲಿ ಪರಿವರ್ತನೆ, ಇದು ಭಾಗಗಳನ್ನು ರೂಪಿಸುವ ಮೂಲಕ ಸಂಬಂಧಿತ ಸ್ಥಾನಗಳನ್ನು ಕುಶಲತೆಯಿಂದ ನಿರ್ವಹಿಸಲು ಸಾಧ್ಯವಾಯಿತು, ಇದರಲ್ಲಿ ಪ್ರತ್ಯೇಕ ಪಿಕ್ಸೆಲ್‌ಗಳ ಸಂಪೂರ್ಣ ನಿರ್ದೇಶಾಂಕಗಳನ್ನು ಜೋಡಿಸಲಾಗಿಲ್ಲ ಚಿತ್ರ, ಆದರೆ ಪ್ರತಿನಿಧಿಸಿದ ವಸ್ತುಗಳ ಮೇಲ್ಮೈಗೆ ನಿವಾರಿಸಲಾಗಿದೆ.

ಹಾಗೆಯೇ StyleGAN ಮತ್ತು StyleGAN2 ನಲ್ಲಿ, ನಿರ್ಮಾಣದ ಸಮಯದಲ್ಲಿ ಪಿಕ್ಸೆಲ್‌ಗಳಿಗೆ ಸ್ನ್ಯಾಪ್ ಆಗುವುದು ಕ್ರಿಯಾತ್ಮಕ ರೆಂಡರಿಂಗ್‌ನಲ್ಲಿ ಸಮಸ್ಯೆಗಳನ್ನು ಉಂಟುಮಾಡಿತುಉದಾಹರಣೆಗೆ, ಚಿತ್ರವು ಚಲಿಸುವಾಗ, ಸುಕ್ಕುಗಳು ಮತ್ತು ಕೂದಲಿನಂತಹ ಸಣ್ಣ ವಿವರಗಳ ಅಸಾಮರಸ್ಯವಿತ್ತು, ಅದು ಮುಖದ ಉಳಿದ ಭಾಗದಿಂದ ಪ್ರತ್ಯೇಕವಾಗಿ ಚಲಿಸುವಂತೆ ಕಾಣುತ್ತದೆ, ಜೊತೆಗೆ StyleGAN3 ನಲ್ಲಿ ಈ ಸಮಸ್ಯೆಗಳನ್ನು ಪರಿಹರಿಸಲಾಗಿದೆ ಮತ್ತು ತಂತ್ರಜ್ಞಾನವನ್ನು ಹೊಂದಿದೆ ವೀಡಿಯೊ ಪೀಳಿಗೆಗೆ ಸಾಕಷ್ಟು ಸೂಕ್ತವಾಗಿದೆ.

ಅಂತಿಮವಾಗಿ, ಸಹ ಉಲ್ಲೇಖಿಸಲು ಯೋಗ್ಯವಾಗಿದೆ ನ ಘೋಷಣೆ ಅತಿದೊಡ್ಡ MT-NLG ಭಾಷಾ ಮಾದರಿಯ NVIDIA ಮತ್ತು ಮೈಕ್ರೋಸಾಫ್ಟ್ ಸೃಷ್ಟಿ ಆಳವಾದ ನರಮಂಡಲವನ್ನು ಆಧರಿಸಿ ಒಂದು "ಪರಿವರ್ತಕ" ವಾಸ್ತುಶಿಲ್ಪ.

ಮಾದರಿಯು 530 ಬಿಲಿಯನ್ ನಿಯತಾಂಕಗಳನ್ನು ಒಳಗೊಂಡಿದೆ ಮತ್ತು 4480 ಜಿಪಿಯುಗಳ ಪೂಲ್ ಅನ್ನು ಬಳಸಲಾಗಿದೆ ತರಬೇತಿಗಾಗಿ (560 DGX A100 ಸರ್ವರ್‌ಗಳು 8 A100 GPU ಗಳೊಂದಿಗೆ 80 GB ಪ್ರತಿ). ಮಾದರಿಯ ಅನ್ವಯದ ಪ್ರದೇಶಗಳನ್ನು ನೈಸರ್ಗಿಕ ಭಾಷೆಯಲ್ಲಿ ಮಾಹಿತಿ ಸಂಸ್ಕರಣಾ ಸಮಸ್ಯೆ ಪರಿಹಾರ ಎಂದು ಕರೆಯುತ್ತಾರೆ, ಅಂದರೆ ಅಪೂರ್ಣ ವಾಕ್ಯವನ್ನು ಪೂರ್ಣಗೊಳಿಸುವುದನ್ನು ಊಹಿಸುವುದು, ಪ್ರಶ್ನೆಗಳಿಗೆ ಉತ್ತರಿಸುವುದು, ಗ್ರಹಿಕೆಯನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದು, ನೈಸರ್ಗಿಕ ಭಾಷೆಯಲ್ಲಿ ತೀರ್ಮಾನಗಳನ್ನು ರೂಪಿಸುವುದು ಮತ್ತು ಪದಗಳ ಅರ್ಥದ ಅಸ್ಪಷ್ಟತೆಯನ್ನು ವಿಶ್ಲೇಷಿಸುವುದು.

ನೀವು ಅದರ ಬಗ್ಗೆ ಇನ್ನಷ್ಟು ತಿಳಿದುಕೊಳ್ಳಲು ಆಸಕ್ತಿ ಹೊಂದಿದ್ದರೆ, ನೀವು StyleGAN3 ನ ವಿವರಗಳನ್ನು ಪರಿಶೀಲಿಸಬಹುದು ಕೆಳಗಿನ ಲಿಂಕ್‌ನಲ್ಲಿ.


ನಿಮ್ಮ ಅಭಿಪ್ರಾಯವನ್ನು ಬಿಡಿ

ನಿಮ್ಮ ಈಮೇಲ್ ವಿಳಾಸ ಪ್ರಕಟವಾದ ಆಗುವುದಿಲ್ಲ. ಅಗತ್ಯವಿರುವ ಜಾಗ ಗುರುತಿಸಲಾಗಿದೆ *

*

*

  1. ಡೇಟಾಗೆ ಜವಾಬ್ದಾರಿ: AB ಇಂಟರ್ನೆಟ್ ನೆಟ್ವರ್ಕ್ಸ್ 2008 SL
  2. ಡೇಟಾದ ಉದ್ದೇಶ: ನಿಯಂತ್ರಣ SPAM, ಕಾಮೆಂಟ್ ನಿರ್ವಹಣೆ.
  3. ಕಾನೂನುಬದ್ಧತೆ: ನಿಮ್ಮ ಒಪ್ಪಿಗೆ
  4. ಡೇಟಾದ ಸಂವಹನ: ಕಾನೂನುಬದ್ಧ ಬಾಧ್ಯತೆಯನ್ನು ಹೊರತುಪಡಿಸಿ ಡೇಟಾವನ್ನು ಮೂರನೇ ವ್ಯಕ್ತಿಗಳಿಗೆ ಸಂವಹನ ಮಾಡಲಾಗುವುದಿಲ್ಲ.
  5. ಡೇಟಾ ಸಂಗ್ರಹಣೆ: ಆಕ್ಸೆಂಟಸ್ ನೆಟ್‌ವರ್ಕ್‌ಗಳು (ಇಯು) ಹೋಸ್ಟ್ ಮಾಡಿದ ಡೇಟಾಬೇಸ್
  6. ಹಕ್ಕುಗಳು: ಯಾವುದೇ ಸಮಯದಲ್ಲಿ ನೀವು ನಿಮ್ಮ ಮಾಹಿತಿಯನ್ನು ಮಿತಿಗೊಳಿಸಬಹುದು, ಮರುಪಡೆಯಬಹುದು ಮತ್ತು ಅಳಿಸಬಹುದು.