GoogleはXNUMXつの重要なシステムを開きます

Googleのスピーチロゴ

グーグルは、多数のオープンソースプロジェクトを持っていることを特徴とする会社です。 しかし最近、彼はオープンソースコミュニティのためにいくつかの非常に興味深い動きをし、彼の大きなプロジェクトのうちのXNUMXつを開いています。 これらはAndroidに関連していますが、どちらもまったく異なります。 これで、GitHubから数週間すべての人が利用できるようになります...

私たちが話している最初のプロジェクトは、LiveTranscribeの音声エンジンです。 音声認識と音声からテキストへの文字起こし アンドロイド用。 これは、音声をリアルタイムで字幕に変換する機械学習アルゴリズムに基づいています。 あなたがそれについて考えるならば、それは私たちが非常に誇りに思う必要がある側面ではなく、はるかに多くのことができるので、コミュニティにとってだけでなく、Linuxシステムのアクセシビリティを改善することも重要です。

一方、Googleは別のソフトウェアシステムもオープンしました。 そしてそれは Androidのジェスチャー追跡。 これらのタイプのプロジェクトは、すでにオープンソースで利用可能なプロジェクトの中であまり頻繁ではないので、朗報です。 このコードがあると、開発者はそれらに基づいてより良いシステムを作成できます。 そして、繰り返しますが、Androidではこの側面が大幅に改善されていますが、オープンソースオペレーティングシステムではアクセシビリティやあまり注意を払っていない特定の側面を改善することが重要です...

このXNUMX番目にリリースされたシステムであるジェスチャ追跡システムでは、MediaPiple機械学習フレームワーク上に構築されています。 このソフトウェアは結合します 人工知能のXNUMXつのコンポーネント:手のひら検出器、3Dハンドポイントを返すモデル、およびジェスチャ認識機能。 このようにして、さまざまなドメインや技術プラットフォームでのエクスペリエンスが向上します。

Github- 音声認識

Github- ジェスチャ認識


コメントを残す

あなたのメールアドレスが公開されることはありません。 必須フィールドには付いています *

*

*

  1. データの責任者:AB Internet Networks 2008 SL
  2. データの目的:SPAMの制御、コメント管理。
  3. 正当化:あなたの同意
  4. データの伝達:法的義務がある場合を除き、データが第三者に伝達されることはありません。
  5. データストレージ:Occentus Networks(EU)がホストするデータベース
  6. 権利:いつでも情報を制限、回復、削除できます。

  1.   jano

    うまくいけば、誰かがライブ翻訳者と一緒に何かを開発することに興味を持っています。 面接などでお世話になっている方は、いつまでもありがとうございました!