ಮೊಜಿಲ್ಲಾ ಕಾಮನ್ ವಾಯ್ಸ್ 7.0 13,000 ಗಂಟೆಗಳಿಗಿಂತ ಹೆಚ್ಚಿನ ಧ್ವನಿ ಡೇಟಾದೊಂದಿಗೆ ಬರುತ್ತದೆ

ಇತ್ತೀಚೆಗೆ ಎನ್ವಿಡಿಯಾ ಮತ್ತು ಮೊಜಿಲ್ಲಾ "ಮೊಜಿಲ್ಲಾ ಕಾಮನ್ ವಾಯ್ಸ್ 7.0" ನ ಹೊಸ ಆವೃತ್ತಿಯನ್ನು ಬಿಡುಗಡೆ ಮಾಡುವುದಾಗಿ ಘೋಷಿಸಿತು ಇದು ಸಾಮೂಹಿಕ ಮೂಲದ 13.000 ಗಂಟೆಗಳ ಧ್ವನಿ ಡೇಟಾವನ್ನು ಪ್ರತಿನಿಧಿಸುತ್ತದೆ ಮತ್ತು ಇನ್ನೊಂದು 16 ಭಾಷೆಗಳ ಸೇರ್ಪಡೆ ಮತ್ತು ಕೊನೆಯ ನವೀಕರಣಕ್ಕೆ ಹೋಲಿಸಿದರೆ, ಗಾತ್ರ ವಸ್ತು ಪರಿಮಾಣ ಸಂಗ್ರಹದಲ್ಲಿ ಮಾತನಾಡುತ್ತಿದ್ದಾರೆ ಇದು ಸುಮಾರು 50% ಹೆಚ್ಚಾಗಿದೆ.

ಸಹ, ಬೆಂಬಲಿತ ಭಾಷೆಗಳ ಸಂಖ್ಯೆ 60 ರಿಂದ 76 ಕ್ಕೆ ಏರಿಕೆಯಾಗಿದೆ, ಮೊದಲ ಬಾರಿಗೆ ಬೆಲರೂಸಿಯನ್, ಕazಕ್, ಉಜ್ಬೇಕ್, ಬಲ್ಗೇರಿಯನ್, ಅರ್ಮೇನಿಯನ್, ಅಜೆರ್ಬೈಜಾನ್ ಮತ್ತು ಬಶ್ಕಿರ್ ಭಾಷೆಗಳಿಗೆ ಹೆಚ್ಚುವರಿ ಬೆಂಬಲವನ್ನು ಒಳಗೊಂಡಿದೆ.

ಸಾಮಾನ್ಯ ಧ್ವನಿಯ ಪರಿಚಯವಿಲ್ಲದವರಿಗೆ, ಇ ಎಂದು ಅವರು ತಿಳಿದಿರಬೇಕುಇದು ಓಪನ್ ಡೇಟಾ ವಾಯ್ಸ್ ಡೇಟಾ ಸೆಟ್ ಆಗಿದೆ ವಿಶ್ವದ ಅತಿದೊಡ್ಡ ಮತ್ತು ಧ್ವನಿ ತಂತ್ರಜ್ಞಾನವನ್ನು ಪ್ರಜಾಪ್ರಭುತ್ವಗೊಳಿಸಲು ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ. ಇದನ್ನು ಸಂಶೋಧಕರು, ಶಿಕ್ಷಣ ತಜ್ಞರು ಮತ್ತು ಅಭಿವರ್ಧಕರು ಬಳಸುತ್ತಾರೆ ವಿಶ್ವದಾದ್ಯಂತ.

ಧ್ವನಿ ಡೇಟಾವನ್ನು ದಾನ ಮಾಡಲು ಉದ್ಯೋಗಿಗಳು ತಮ್ಮದೇ ಸಮುದಾಯಗಳನ್ನು ಸಜ್ಜುಗೊಳಿಸುತ್ತಾರೆ MCV ಯ ಸಾರ್ವಜನಿಕ ಡೇಟಾಬೇಸ್‌ಗೆ, ಧ್ವನಿ-ಸಕ್ರಿಯಗೊಳಿಸಿದ ತಂತ್ರಜ್ಞಾನವನ್ನು ತರಬೇತಿ ಮಾಡಲು ಯಾರಾದರೂ ಬಳಸಬಹುದು. ಎನ್ವಿಡಿಯಾ ಸಹಯೋಗದ ಭಾಗವಾಗಿ ಸಿಮೊಜಿಲ್ಲಾ ಸಾಮಾನ್ಯ ಧ್ವನಿಯಲ್ಲಿ, ಇದರಲ್ಲಿ ತರಬೇತಿ ಪಡೆದ ಮಾದರಿಗಳು ಮತ್ತು ಇತರ ಸಾರ್ವಜನಿಕ ಡೇಟಾ ಸೆಟ್‌ಗಳು ಉಚಿತವಾಗಿ ಲಭ್ಯವಿದೆ NVIDIA NeMo ಎಂಬ ಓಪನ್ ಸೋರ್ಸ್ ಟೂಲ್ಕಿಟ್ ಮೂಲಕ.

ಯೋಜನೆಯು ಧ್ವನಿ ಟೆಂಪ್ಲೆಟ್ಗಳ ಡೇಟಾಬೇಸ್ ಅನ್ನು ಸಂಗ್ರಹಿಸಲು ಜಂಟಿ ಕೆಲಸವನ್ನು ಸಂಘಟಿಸುವ ಗುರಿಯನ್ನು ಹೊಂದಿದೆ, ಎಲ್ಲಾ ರೀತಿಯ ಧ್ವನಿಗಳು ಮತ್ತು ಮಾತನಾಡುವ ವಿಧಾನಗಳನ್ನು ಗಣನೆಗೆ ತೆಗೆದುಕೊಳ್ಳುವುದು. ಮಾನವ ಭಾಷಣದ ವಿಶಿಷ್ಟವಾದ ಪದಗುಚ್ಛಗಳ ವಿವಿಧ ಉಚ್ಚಾರಣೆಗಳ ದಾಖಲೆಗಳೊಂದಿಗೆ ಸಂಗ್ರಹವಾದ ಡೇಟಾಬೇಸ್ ಅನ್ನು ಯಂತ್ರ ಕಲಿಕಾ ವ್ಯವಸ್ಥೆಗಳಲ್ಲಿ ಮತ್ತು ಸಂಶೋಧನಾ ಯೋಜನೆಗಳಲ್ಲಿ ನಿರ್ಬಂಧಗಳಿಲ್ಲದೆ ಬಳಸಬಹುದು.

ವೋಸ್ಕ್ ನಿರಂತರ ಧ್ವನಿ ಗುರುತಿಸುವಿಕೆ ಗ್ರಂಥಾಲಯದ ಲೇಖಕರ ಪ್ರಕಾರ, ಸಾಮಾನ್ಯ ಧ್ವನಿ ಗುಂಪಿನ ನ್ಯೂನತೆಗಳು ಗಾಯನ ವಸ್ತುವಿನ ಏಕಮುಖವಾಗಿದೆ (20 ಮತ್ತು 30 ರ ವಯಸ್ಸಿನ ಪುರುಷರ ಪ್ರಾಬಲ್ಯ ಮತ್ತು ಮಹಿಳೆಯರ, ಮಕ್ಕಳ ಧ್ವನಿಯೊಂದಿಗೆ ವಸ್ತುಗಳ ಕೊರತೆ ಮತ್ತು ವಯಸ್ಸಾದವರು), ಶಬ್ದಕೋಶದ ವ್ಯತ್ಯಾಸದ ಕೊರತೆ (ಅದೇ ಪದಗುಚ್ಛಗಳ ಪುನರಾವರ್ತನೆ) ಮತ್ತು ಅಸ್ಪಷ್ಟತೆಗೆ ಒಳಗಾಗುವ MP3 ರೆಕಾರ್ಡಿಂಗ್ ವಿತರಣೆ.

ಸಾಮಾನ್ಯ ಧ್ವನಿ 7.0 ರ ಹೊಸ ಆವೃತ್ತಿಯ ಬಗ್ಗೆ

ಈ ಹೊಸ ಆವೃತ್ತಿಯಲ್ಲಿ 75 ಸಾವಿರಕ್ಕೂ ಹೆಚ್ಚು ಜನರು ಭಾಗವಹಿಸಿದ್ದರು ಇಂಗ್ಲಿಷ್‌ನಲ್ಲಿ ಸಾಮಗ್ರಿಗಳ ತಯಾರಿಕೆಯಲ್ಲಿ, 2637 ಗಂಟೆಗಳ ದೃ confirmedೀಕರಿಸಿದ ಭಾಷಣವನ್ನು ನಿರ್ದೇಶಿಸುತ್ತದೆ (66 ಸಾವಿರ ಭಾಗವಹಿಸುವವರು ಮತ್ತು 1686 ಗಂಟೆಗಳು ಇದ್ದವು).

ನಾವು ಆರಂಭದಲ್ಲಿ ಹೇಳಿದಂತೆ, ಈ ಹೊಸ ಆವೃತ್ತಿಯು 16 ಹೊಸ ಭಾಷೆಗಳನ್ನು ಪರಿಚಯಿಸುತ್ತದೆ ಕಾಮನ್ ವಾಯ್ಸ್ ಡಾಟಾಸೆಟ್‌ಗೆ ಒಟ್ಟು 76 ಭಾಷೆಗಳಿಗೆ ಹೋಗುತ್ತದೆ, ಅದರಲ್ಲಿ ಅಗ್ರ ಐದು ಭಾಷೆಗಳು ಇಂಗ್ಲೀಷ್ (2.630 ಗಂಟೆಗಳು), ಕಿನ್ಯಾರ್ವಾಂಡಾ (2.260), ಜರ್ಮನ್ (1.040), ಕ್ಯಾಟಲಾನ್ (920) ಮತ್ತು ಎಸ್ಪೆರಾಂಟೊ (840) .

ಶೇಕಡಾವಾರು ಪ್ರಮಾಣದಲ್ಲಿ ಹೆಚ್ಚಾದ ಭಾಷೆಗಳು ಥಾಯ್ (ಸುಮಾರು 20 ಪಟ್ಟು ಬೆಳವಣಿಗೆ, 12 ಗಂಟೆಯಿಂದ 250 ಗಂಟೆಗಳವರೆಗೆ), ಲುಗಾಂಡ (9 ಪಟ್ಟು ಬೆಳವಣಿಗೆ, 8 ಗಂಟೆಯಿಂದ 80 ಗಂಟೆಗಳವರೆಗೆ), ಎಸ್ಪೆರಾಂಟೊ (7 ಕ್ಕಿಂತ 100 ಗಂಟೆಗಳವರೆಗೆ 840 ಪಟ್ಟು ಹೆಚ್ಚು ಬೆಳವಣಿಗೆ) ಮತ್ತು ತಮಿಳು (8x ಕ್ಕಿಂತ ಹೆಚ್ಚು ಬೆಳವಣಿಗೆ, 24 ಗಂಟೆಗಳಿಂದ 220 ಗಂಟೆಗಳವರೆಗೆ). ಕುತೂಹಲದಿಂದ, ಸಂಚಿತ ಡೇಟಾದ ವಿಷಯದಲ್ಲಿ ರುವಾಂಡ ಎರಡನೇ ಸ್ಥಾನದಲ್ಲಿದೆ, ಇದಕ್ಕಾಗಿ 2260 ಗಂಟೆಗಳನ್ನು ಸಂಗ್ರಹಿಸಲಾಗಿದೆ. ಅವುಗಳ ನಂತರ ಜರ್ಮನ್ (1040), ಕ್ಯಾಟಲಾನ್ (920) ಮತ್ತು ಎಸ್ಪೆರಾಂಟೊ (840) ಇವೆ. ಡೇಟಾಸೆಟ್ ಈಗ 182,000 ಅನನ್ಯ ಧ್ವನಿಗಳನ್ನು ಹೊಂದಿದೆ, ಕೇವಲ ಆರು ತಿಂಗಳಲ್ಲಿ ತೆರಿಗೆದಾರರ ಸಮುದಾಯದಲ್ಲಿ 25% ಬೆಳವಣಿಗೆ.

ಯೋಜನೆಯಲ್ಲಿ ಅವರ ಭಾಗವಹಿಸುವಿಕೆಯ ಭಾಗವಾಗಿ, ಇದನ್ನು ಉಲ್ಲೇಖಿಸಲಾಗಿದೆ. ಯಂತ್ರ ಕಲಿಕಾ ವ್ಯವಸ್ಥೆಗಳಿಗಾಗಿ NVIDIA ಬಳಕೆಗೆ ಸಿದ್ಧ ತರಬೇತಿ ಪಡೆದ ಮಾದರಿಗಳನ್ನು ಸಿದ್ಧಪಡಿಸಿದೆ ಸಂಗ್ರಹಿಸಿದ ಡೇಟಾವನ್ನು ಆಧರಿಸಿ (PyTorch ಗೆ ಹೊಂದಿಕೊಳ್ಳುತ್ತದೆ). ಮಾದರಿಗಳನ್ನು ಉಚಿತ ಮತ್ತು ತೆರೆದ NVIDIA NeMo ಉಪಕರಣದ ಭಾಗವಾಗಿ ವಿತರಿಸಲಾಗಿದೆ, ಉದಾಹರಣೆಗೆ, MTS ಮತ್ತು Sberbank ನ ಸ್ವಯಂಚಾಲಿತ ಧ್ವನಿ ಸೇವೆಗಳಲ್ಲಿ ಈಗಾಗಲೇ ಇದನ್ನು ಬಳಸಲಾಗಿದೆ.

ಮಾದರಿಗಳು ಇವೆ ನೈಸರ್ಗಿಕ ಭಾಷೆಯಲ್ಲಿ ಭಾಷಣ ಗುರುತಿಸುವಿಕೆ, ಭಾಷಣ ಸಂಶ್ಲೇಷಣೆ ಮತ್ತು ಮಾಹಿತಿ ಸಂಸ್ಕರಣಾ ವ್ಯವಸ್ಥೆಗಳ ಗುರಿಯನ್ನು ಹೊಂದಿದೆ ಮತ್ತು ಧ್ವನಿ ಸಂವಾದ ವ್ಯವಸ್ಥೆಗಳು, ಪ್ರತಿಲೇಖನ ವೇದಿಕೆಗಳು ಮತ್ತು ಸ್ವಯಂಚಾಲಿತ ಕರೆ ಕೇಂದ್ರಗಳ ವಿನ್ಯಾಸದಲ್ಲಿ ಅವು ಸಂಶೋಧಕರಿಗೆ ಉಪಯುಕ್ತವಾಗಬಹುದು. ಹಿಂದೆ ಲಭ್ಯವಿರುವ ಯೋಜನೆಗಳಿಗಿಂತ ಭಿನ್ನವಾಗಿ, ಪ್ರಕಟಿತ ಮಾದರಿಗಳು ಇಂಗ್ಲಿಷ್ ಗುರುತಿಸುವಿಕೆಗೆ ಸೀಮಿತವಾಗಿಲ್ಲ ಮತ್ತು ವಿವಿಧ ಭಾಷೆಗಳು, ಉಚ್ಚಾರಣೆಗಳು ಮತ್ತು ಮಾತಿನ ರೂಪಗಳನ್ನು ಒಳಗೊಂಡಿರುತ್ತವೆ.

ಅಂತಿಮವಾಗಿ ನೀವು ಅದರ ಬಗ್ಗೆ ಇನ್ನಷ್ಟು ತಿಳಿದುಕೊಳ್ಳಲು ಆಸಕ್ತಿ ಹೊಂದಿದ್ದರೆ, ನೀವು ವಿವರಗಳನ್ನು ಪರಿಶೀಲಿಸಬಹುದು ಕೆಳಗಿನ ಲಿಂಕ್.


ನಿಮ್ಮ ಅಭಿಪ್ರಾಯವನ್ನು ಬಿಡಿ

ನಿಮ್ಮ ಈಮೇಲ್ ವಿಳಾಸ ಪ್ರಕಟವಾದ ಆಗುವುದಿಲ್ಲ. ಅಗತ್ಯವಿರುವ ಜಾಗ ಗುರುತಿಸಲಾಗಿದೆ *

*

*

  1. ಡೇಟಾಗೆ ಜವಾಬ್ದಾರಿ: AB ಇಂಟರ್ನೆಟ್ ನೆಟ್ವರ್ಕ್ಸ್ 2008 SL
  2. ಡೇಟಾದ ಉದ್ದೇಶ: ನಿಯಂತ್ರಣ SPAM, ಕಾಮೆಂಟ್ ನಿರ್ವಹಣೆ.
  3. ಕಾನೂನುಬದ್ಧತೆ: ನಿಮ್ಮ ಒಪ್ಪಿಗೆ
  4. ಡೇಟಾದ ಸಂವಹನ: ಕಾನೂನುಬದ್ಧ ಬಾಧ್ಯತೆಯನ್ನು ಹೊರತುಪಡಿಸಿ ಡೇಟಾವನ್ನು ಮೂರನೇ ವ್ಯಕ್ತಿಗಳಿಗೆ ಸಂವಹನ ಮಾಡಲಾಗುವುದಿಲ್ಲ.
  5. ಡೇಟಾ ಸಂಗ್ರಹಣೆ: ಆಕ್ಸೆಂಟಸ್ ನೆಟ್‌ವರ್ಕ್‌ಗಳು (ಇಯು) ಹೋಸ್ಟ್ ಮಾಡಿದ ಡೇಟಾಬೇಸ್
  6. ಹಕ್ಕುಗಳು: ಯಾವುದೇ ಸಮಯದಲ್ಲಿ ನೀವು ನಿಮ್ಮ ಮಾಹಿತಿಯನ್ನು ಮಿತಿಗೊಳಿಸಬಹುದು, ಮರುಪಡೆಯಬಹುದು ಮತ್ತು ಅಳಿಸಬಹುದು.