Google là một công ty có đặc điểm là có một số lượng lớn các dự án mã nguồn mở. Nhưng gần đây anh ấy đã thực hiện một số động thái rất thú vị cho cộng đồng mã nguồn mở, đó là mở hai dự án lớn của anh ấy. Chúng đều liên quan đến Android, nhưng cả hai đều khá khác biệt với nhau. Giờ đây, chúng sẽ có sẵn từ GitHub cho mọi người trong vài tuần nữa ...
Dự án đầu tiên mà chúng tôi đang nói đến là công cụ giọng nói cho Tạo phụ đề trực tiếp, một công cụ thú vị để nhận dạng giọng nói và chuyển giọng nói thành văn bản dành cho Android. Nó dựa trên các thuật toán học máy để chuyển đổi âm thanh thành phụ đề trong thời gian thực. Nếu bạn nghĩ về nó, nó không chỉ quan trọng đối với cộng đồng mà còn là cải thiện khả năng truy cập của các hệ thống Linux, vì nó không phải là một khía cạnh mà chúng ta phải vô cùng tự hào và có thể làm được nhiều hơn thế.
Mặt khác, Google cũng đã mở một hệ thống phần mềm khác của mình. Và nó là của theo dõi cử chỉ cho Android. Những loại dự án này không thường xuyên xảy ra trong số những dự án đã có sẵn mã nguồn mở, vì vậy đó là một tin tốt. Có mã này sẽ cho phép các nhà phát triển xây dựng các hệ thống tốt hơn dựa trên chúng. Và, tôi nhắc lại, điều quan trọng là cải thiện khả năng tiếp cận hoặc một số khía cạnh không quá cẩn thận trong hệ điều hành mã nguồn mở, mặc dù trong Android khía cạnh này đã được cải thiện rất nhiều ...
Trong hệ thống được phát hành thứ hai này, hệ thống theo dõi cử chỉ, nó được xây dựng trên một khuôn khổ học máy MediaPiple. Phần mềm này kết hợp ba thành phần của trí tuệ nhân tạo: một máy dò lòng bàn tay, một mô hình trả về các điểm tay 3D và một bộ nhận dạng cử chỉ. Bằng cách này, trải nghiệm trong nhiều lĩnh vực và nền tảng công nghệ sẽ được cải thiện.
Github - nhận dạng giọng nói
Github - công nhận cử chỉ
Hy vọng rằng ai đó quan tâm đến việc phát triển một cái gì đó với phiên dịch trực tiếp. Ai trong chúng ta, những người làm việc với các cuộc phỏng vấn và những điều như vậy sẽ cảm ơn bạn mãi mãi!