ಎನ್‌ಕೋಡೆಕ್, ಹೊಸ ಮೆಟಾ ಆಡಿಯೊ ಕೊಡೆಕ್

ಎನ್ಕೋಡೆಕ್

ಎನ್ಕೋಡೆಕ್ ಒಂದು ಕೊಡೆಕ್ ಆಗಿದ್ದು ಅದು ಸುಮಾರು 10x ಸಂಕುಚಿತ ದರದೊಂದಿಗೆ ನರಮಂಡಲವನ್ನು ಬಳಸಿಕೊಂಡು ಡಿಕೋಡ್ ಮಾಡುತ್ತದೆ

ಇತ್ತೀಚೆಗೆ, ಮೆಟಾ (ಹಿಂದೆ ಫೇಸ್‌ಬುಕ್) ಎನ್‌ಕೋಡೆಕ್ ಎಂಬ ತನ್ನ ಹೊಸ ಆಡಿಯೊ ಕೊಡೆಕ್ ಅನ್ನು ಅನಾವರಣಗೊಳಿಸಿದೆ, ಕ್ಯು ಯಂತ್ರ ಕಲಿಕೆಯ ತಂತ್ರಗಳನ್ನು ಬಳಸುತ್ತದೆ ಗುಣಮಟ್ಟವನ್ನು ಕಳೆದುಕೊಳ್ಳದೆ ಸಂಕೋಚನ ಅನುಪಾತವನ್ನು ಹೆಚ್ಚಿಸಲು.

ಹೊಸ ವಿಧಾನವು ಅತ್ಯಾಧುನಿಕ ಗಾತ್ರದ ಕಡಿತವನ್ನು ಸಾಧಿಸಲು ನೈಜ ಸಮಯದಲ್ಲಿ ಆಡಿಯೊವನ್ನು ಕುಗ್ಗಿಸಬಹುದು ಮತ್ತು ಡಿಕಂಪ್ರೆಸ್ ಮಾಡಬಹುದು. ಕೊಡೆಕ್ ನೈಜ ಸಮಯದಲ್ಲಿ ಸ್ಟ್ರೀಮಿಂಗ್ ಆಡಿಯೊ ಎರಡಕ್ಕೂ ಬಳಸಬಹುದು ಫೈಲ್‌ಗಳಲ್ಲಿ ನಂತರದ ಸಂಗ್ರಹಣೆಗಾಗಿ ಎನ್‌ಕೋಡಿಂಗ್‌ಗಾಗಿ.

ಇಂದು, ನಮ್ಮ ಮೂಲಭೂತ AI ಸಂಶೋಧನೆ (FAIR) AI-ಚಾಲಿತ ಆಡಿಯೊ ಹೈಪರ್ ಕಂಪ್ರೆಷನ್‌ನ ಕ್ಷೇತ್ರದಲ್ಲಿ ಸಾಧಿಸಿರುವ ಪ್ರಗತಿಯನ್ನು ನಾವು ವಿವರಿಸುತ್ತಿದ್ದೇವೆ. ಕಳಪೆ ಸಂಪರ್ಕವಿರುವ ಪ್ರದೇಶದಲ್ಲಿ ಸ್ನೇಹಿತರ ಆಡಿಯೊ ಸಂದೇಶವನ್ನು ಕೇಳುವುದನ್ನು ಊಹಿಸಿ ಮತ್ತು ನಿಲ್ಲಿಸುವುದಿಲ್ಲ ಅಥವಾ ಕ್ರ್ಯಾಶ್ ಆಗುವುದಿಲ್ಲ. ಇದನ್ನು ಸಾಧಿಸಲು ನಮಗೆ ಸಹಾಯ ಮಾಡಲು ನಾವು AI ಅನ್ನು ಹೇಗೆ ಬಳಸಬಹುದು ಎಂಬುದನ್ನು ನಮ್ಮ ಸಂಶೋಧನೆ ತೋರಿಸುತ್ತದೆ.

ಕೋಡೆಕ್‌ನಲ್ಲಿ ಎರಡು ಮಾದರಿಗಳನ್ನು ನೀಡುತ್ತವೆ ಡೌನ್‌ಲೋಡ್ ಮಾಡಲು ಸಿದ್ಧ:

  1. 24 kHz ಮಾದರಿ ದರವನ್ನು ಬಳಸುವ ಸಾಂದರ್ಭಿಕ ಮಾದರಿ, ಮೊನೊಫೊನಿಕ್ ಆಡಿಯೊವನ್ನು ಮಾತ್ರ ಬೆಂಬಲಿಸುತ್ತದೆ ಮತ್ತು ವಿವಿಧ ಆಡಿಯೊ ಡೇಟಾದ ಮೇಲೆ ತರಬೇತಿ ನೀಡಲಾಗುತ್ತದೆ (ಸ್ಪೀಚ್ ಎನ್‌ಕೋಡಿಂಗ್‌ಗೆ ಸೂಕ್ತವಾಗಿದೆ). 1,5, 3, 6, 12 ಮತ್ತು 24 kbps ಬಿಟ್ ದರಗಳಲ್ಲಿ ಪ್ರಸಾರಕ್ಕಾಗಿ ಆಡಿಯೊ ಡೇಟಾವನ್ನು ಪ್ಯಾಕ್ ಮಾಡಲು ಮಾದರಿಯನ್ನು ಬಳಸಬಹುದು.
  2. 48kHz ಮಾದರಿ ದರವನ್ನು ಬಳಸುವ, ಸ್ಟಿರಿಯೊ ಧ್ವನಿಯನ್ನು ಬೆಂಬಲಿಸುವ ಮತ್ತು ಸಂಗೀತದ ಮೇಲೆ ಮಾತ್ರ ತರಬೇತಿ ಪಡೆದ ಕಾರಣವಲ್ಲದ ಮಾದರಿ. ಮಾದರಿಯು 3, 6, 12 ಮತ್ತು 24 kbps ನ ಬಿಟ್ ದರಗಳನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ.

ಪ್ರತಿ ಮಾದರಿಗೆ, ಹೆಚ್ಚುವರಿ ಭಾಷಾ ಮಾದರಿಯನ್ನು ಸಿದ್ಧಪಡಿಸಲಾಗಿದೆ, ಏನು ಗಮನಾರ್ಹ ಹೆಚ್ಚಳವನ್ನು ಅನುಮತಿಸುತ್ತದೆ ಗುಣಮಟ್ಟವನ್ನು ಕಳೆದುಕೊಳ್ಳದೆ ಸಂಕೋಚನ ಅನುಪಾತದಲ್ಲಿ (40% ವರೆಗೆ). ಆಡಿಯೊ ಕಂಪ್ರೆಷನ್‌ಗೆ ಯಂತ್ರ ಕಲಿಕೆಯ ತಂತ್ರಗಳನ್ನು ಅನ್ವಯಿಸಲು ಹಿಂದಿನ ಯೋಜನೆಗಳಿಗಿಂತ ಭಿನ್ನವಾಗಿ, ಎನ್‌ಕೋಡೆಕ್ ಅನ್ನು ಭಾಷಣ ಪ್ಯಾಕೇಜಿಂಗ್‌ಗೆ ಮಾತ್ರವಲ್ಲದೆ ಸಂಗೀತ ಸಂಕೋಚನಕ್ಕಾಗಿಯೂ ಬಳಸಬಹುದು 48 kHz ನ ಮಾದರಿ ಆವರ್ತನದೊಂದಿಗೆ, ಆಡಿಯೊ ಸಿಡಿಗಳ ಮಟ್ಟಕ್ಕೆ ಅನುಗುಣವಾಗಿ.

ಹೊಸ ಕೊಡೆಕ್‌ನ ಅಭಿವರ್ಧಕರ ಪ್ರಕಾರ, MP64 ಫಾರ್ಮ್ಯಾಟ್‌ಗೆ ಹೋಲಿಸಿದರೆ 3 kbps ಬಿಟ್ ದರದಲ್ಲಿ ಪ್ರಸಾರ ಮಾಡುವ ಮೂಲಕ, ಅವರು ಅದೇ ಮಟ್ಟದ ಗುಣಮಟ್ಟವನ್ನು ಉಳಿಸಿಕೊಂಡು ಆಡಿಯೊ ಸಂಕುಚಿತ ಅನುಪಾತವನ್ನು ಸುಮಾರು ಹತ್ತು ಪಟ್ಟು ಹೆಚ್ಚಿಸುವಲ್ಲಿ ಯಶಸ್ವಿಯಾದರು (ಉದಾಹರಣೆಗೆ, MP3 ಬಳಸುವಾಗ ಎನ್‌ಕೋಡೆಕ್‌ನಲ್ಲಿ ಅದೇ ಗುಣಮಟ್ಟದೊಂದಿಗೆ ವರ್ಗಾಯಿಸಲು 64 kbps ಬ್ಯಾಂಡ್‌ವಿಡ್ತ್ ಅಗತ್ಯವಿದೆ, 6 kbps ಸಾಕು).

ಈ ಡೇಟಾವನ್ನು ನಂತರ ನ್ಯೂರಲ್ ನೆಟ್ವರ್ಕ್ ಬಳಸಿ ಡಿಕೋಡ್ ಮಾಡಬಹುದು. MP10 ಗೆ ಹೋಲಿಸಿದರೆ 3kbps ನಲ್ಲಿ ನಾವು ಅಂದಾಜು 64x ಕಂಪ್ರೆಷನ್ ದರವನ್ನು ಸಾಧಿಸಿದ್ದೇವೆ, ಗುಣಮಟ್ಟದಲ್ಲಿ ಯಾವುದೇ ನಷ್ಟವಿಲ್ಲ. ಭಾಷಣಕ್ಕಾಗಿ ಈ ತಂತ್ರಗಳನ್ನು ಮೊದಲು ಪರಿಶೋಧಿಸಲಾಗಿದ್ದರೂ, ಸಂಗೀತ ವಿತರಣೆಗೆ ಮಾನದಂಡವಾಗಿರುವ 48 kHz ಮಾದರಿಯ ಸ್ಟಿರಿಯೊ ಆಡಿಯೊಗೆ (ಅಂದರೆ CD ಗುಣಮಟ್ಟ) ಕೆಲಸ ಮಾಡಲು ನಾವು ಮೊದಲಿಗರಾಗಿದ್ದೇವೆ.

ಕೊಡೆಕ್‌ನ ವಾಸ್ತುಶಿಲ್ಪ ಇದನ್ನು ನರಮಂಡಲದ ಆಧಾರದ ಮೇಲೆ ನಿರ್ಮಿಸಲಾಗಿದೆ "ರೂಪಾಂತರ" ವಾಸ್ತುಶಿಲ್ಪದೊಂದಿಗೆ ಮತ್ತು ನಾಲ್ಕು ಬಂಧಗಳನ್ನು ಆಧರಿಸಿದೆ: ಎನ್‌ಕೋಡರ್, ಕ್ವಾಂಟೈಸರ್, ಡಿಕೋಡರ್ ಮತ್ತು ಡಿಸ್ಕ್ರಿಮಿನೇಟರ್:

  • El ಎನ್ಕೋಡರ್ ಧ್ವನಿ ಡೇಟಾದಿಂದ ಪ್ಯಾರಾಮೀಟರ್‌ಗಳನ್ನು ಹೊರತೆಗೆಯುತ್ತದೆ ಮತ್ತು ಕಡಿಮೆ ಫ್ರೇಮ್ ದರದಲ್ಲಿ ಪ್ಯಾಕೆಟ್ ಮಾಡಲಾದ ಸ್ಟ್ರೀಮ್ ಆಗಿ ಪರಿವರ್ತಿಸುತ್ತದೆ.
  • El ಕ್ವಾಂಟಿಫೈಯರ್ (RVQ, Residual Vector Quantizer) ಎನ್‌ಕೋಡರ್ ಔಟ್‌ಪುಟ್ ಸ್ಟ್ರೀಮ್ ಅನ್ನು ಪ್ಯಾಕೆಟ್‌ಗಳ ಸೆಟ್‌ಗಳಾಗಿ ಪರಿವರ್ತಿಸುತ್ತದೆ, ಆಯ್ದ ಬಿಟ್ ದರಕ್ಕೆ ಸಂಬಂಧಿಸಿದ ಮಾಹಿತಿಯನ್ನು ಸಂಕುಚಿತಗೊಳಿಸುತ್ತದೆ. ಕ್ವಾಂಟೈಜರ್‌ನ ಔಟ್‌ಪುಟ್ ಎನ್ನುವುದು ನೆಟ್‌ವರ್ಕ್ ಮೂಲಕ ಪ್ರಸಾರ ಮಾಡಲು ಅಥವಾ ಡಿಸ್ಕ್‌ಗೆ ಉಳಿಸಲು ಸೂಕ್ತವಾದ ಡೇಟಾದ ಸಂಕುಚಿತ ನಿರೂಪಣೆಯಾಗಿದೆ.
  • El ಡಿಕೋಡರ್ ಸಂಕುಚಿತ ಡೇಟಾ ಪ್ರಾತಿನಿಧ್ಯವನ್ನು ಡಿಕೋಡ್ ಮಾಡುತ್ತದೆ ಮತ್ತು ಮೂಲ ಧ್ವನಿ ತರಂಗವನ್ನು ಪುನರ್ನಿರ್ಮಿಸುತ್ತದೆ.
  • El ತಾರತಮ್ಯಕಾರ ಮಾನವ ಶ್ರವಣೇಂದ್ರಿಯ ಗ್ರಹಿಕೆಯ ಮಾದರಿಯನ್ನು ಗಣನೆಗೆ ತೆಗೆದುಕೊಂಡು ರಚಿತವಾದ ಮಾದರಿಗಳ (ಮಾದರಿ) ಗುಣಮಟ್ಟವನ್ನು ಸುಧಾರಿಸುತ್ತದೆ.

ಗುಣಮಟ್ಟದ ಮಟ್ಟ ಮತ್ತು ಬಿಟ್ರೇಟ್ ಅನ್ನು ಲೆಕ್ಕಿಸದೆಯೇ, ಎನ್ಕೋಡಿಂಗ್ ಮತ್ತು ಡಿಕೋಡಿಂಗ್ಗಾಗಿ ಬಳಸಲಾಗುವ ಮಾದರಿಗಳು ಸಾಕಷ್ಟು ಸಾಧಾರಣ ಸಂಪನ್ಮೂಲ ಅಗತ್ಯತೆಗಳಲ್ಲಿ ಭಿನ್ನವಾಗಿರುತ್ತವೆ (ನೈಜ-ಸಮಯದ ಕಾರ್ಯಾಚರಣೆಗೆ ಅಗತ್ಯವಿರುವ ಲೆಕ್ಕಾಚಾರಗಳನ್ನು ಒಂದು CPU ಕೋರ್ನಲ್ಲಿ ನಿರ್ವಹಿಸಲಾಗುತ್ತದೆ).

ಅಂತಿಮವಾಗಿ, ನಿಮ್ಮಲ್ಲಿ ಆಸಕ್ತಿ ಹೊಂದಿರುವವರಿಗೆ, ಎನ್‌ಕೋಡೆಕ್‌ನ ಉಲ್ಲೇಖದ ಅನುಷ್ಠಾನವನ್ನು ಪೈಟಾರ್ಚ್ ಫ್ರೇಮ್‌ವರ್ಕ್ ಅನ್ನು ಬಳಸಿಕೊಂಡು ಪೈಥಾನ್‌ನಲ್ಲಿ ಬರೆಯಲಾಗಿದೆ ಮತ್ತು ವಾಣಿಜ್ಯೇತರ ಬಳಕೆಗಾಗಿ CC BY-NC 4.0 (ಕ್ರಿಯೇಟಿವ್ ಕಾಮನ್ಸ್ ಆಟ್ರಿಬ್ಯೂಷನ್-ವಾಣಿಜ್ಯೇತರ) ಪರವಾನಗಿ ಅಡಿಯಲ್ಲಿ ಪರವಾನಗಿ ಪಡೆದಿದೆ ಎಂದು ನೀವು ತಿಳಿದಿರಬೇಕು. ಮಾತ್ರ.

ನೀವು ಅದರ ಬಗ್ಗೆ ಇನ್ನಷ್ಟು ತಿಳಿದುಕೊಳ್ಳಲು ಆಸಕ್ತಿ ಹೊಂದಿದ್ದರೆ, ನೀವು ವಿವರಗಳನ್ನು ಇಲ್ಲಿ ಸಂಪರ್ಕಿಸಬಹುದು ಕೆಳಗಿನ ಲಿಂಕ್.


ನಿಮ್ಮ ಅಭಿಪ್ರಾಯವನ್ನು ಬಿಡಿ

ನಿಮ್ಮ ಈಮೇಲ್ ವಿಳಾಸ ಪ್ರಕಟವಾದ ಆಗುವುದಿಲ್ಲ. ಅಗತ್ಯವಿರುವ ಜಾಗ ಗುರುತಿಸಲಾಗಿದೆ *

*

*

  1. ಡೇಟಾಗೆ ಜವಾಬ್ದಾರಿ: AB ಇಂಟರ್ನೆಟ್ ನೆಟ್ವರ್ಕ್ಸ್ 2008 SL
  2. ಡೇಟಾದ ಉದ್ದೇಶ: ನಿಯಂತ್ರಣ SPAM, ಕಾಮೆಂಟ್ ನಿರ್ವಹಣೆ.
  3. ಕಾನೂನುಬದ್ಧತೆ: ನಿಮ್ಮ ಒಪ್ಪಿಗೆ
  4. ಡೇಟಾದ ಸಂವಹನ: ಕಾನೂನುಬದ್ಧ ಬಾಧ್ಯತೆಯನ್ನು ಹೊರತುಪಡಿಸಿ ಡೇಟಾವನ್ನು ಮೂರನೇ ವ್ಯಕ್ತಿಗಳಿಗೆ ಸಂವಹನ ಮಾಡಲಾಗುವುದಿಲ್ಲ.
  5. ಡೇಟಾ ಸಂಗ್ರಹಣೆ: ಆಕ್ಸೆಂಟಸ್ ನೆಟ್‌ವರ್ಕ್‌ಗಳು (ಇಯು) ಹೋಸ್ಟ್ ಮಾಡಿದ ಡೇಟಾಬೇಸ್
  6. ಹಕ್ಕುಗಳು: ಯಾವುದೇ ಸಮಯದಲ್ಲಿ ನೀವು ನಿಮ್ಮ ಮಾಹಿತಿಯನ್ನು ಮಿತಿಗೊಳಿಸಬಹುದು, ಮರುಪಡೆಯಬಹುದು ಮತ್ತು ಅಳಿಸಬಹುದು.