データ分析と機械学習は毎日ますます使用されています 冒険を試みている企業も、一般的に統合の問題に直面しています。 これらの課題に対処するために、 IBMはCodeFlareを導入したばかりです。 オープンソースフレームワーク。 RISEラボのRay分散システムに基づいています カリフォルニア大学バークレー校で機械学習モデルを学びました。
コードフレア フローをスケーリングするための特定の要素を使用してAIの反復プロセスを簡素化することを目的としています データ作業の一部であり、世界初の2ナノメートルのプロトタイプチップのXNUMXつを作成する責任を負うIBMグループのプロジェクトから生まれました。
IBMによると、CodeFlareは、マルチクラウドインフラストラクチャでのビッグデータと人工知能ワークフローの統合と効率的なスケーリングを簡素化するのに役立ちます。
「CodeFlareは、単純化された機械学習の概念を取り入れています...さらに一歩進んで、分離されたステップを超えて、エンドツーエンドのパイプラインを、コンテナーではなくPythonなどのデータサイエンティストに適したインターフェースとシームレスに統合します」 IBM ResearchのプラットフォームであるVentureBeatは、電子メールで…統合されたランタイムとプログラミングインターフェイスを使用して、パイプライン全体の統合とスケーリングを簡素化することで差別化を図っています。
ブログ投稿では、 IBMは、最近の機械学習モデルの作成は非常に手作業であると説明しました。。 研究者は最初にモデルをトレーニングして最適化する必要があります。これには、データクレンジング、特徴抽出、モデルの最適化などのタスクが含まれます。これは、IBMがCodeFlareがこの作業の簡素化に役立つと述べたところです。
CodeFlareはPythonプログラミング言語に基づくインターフェースを使用してパイプラインを作成するため、 これにより、データの統合、並列化、共有が容易になります。 CodeFlareを使用すると、インフラストラクチャの種類ごとに新しいワークフロー言語を学習することなく、複数のクラウドコンピューティングプラットフォーム間でパイプラインワークフローを統合できます。
IBMはパイプラインを言った 新しいIBMCloud CodeEngineを含む任意のクラウドインフラストラクチャにデプロイできます。 これはサーバーレスプラットフォームであり、Red Hat OpenShiftであり、さらに、新しいファイルの到着などのイベントトリガー用のアダプターも提供します。これは、パイプが他のクラウドネイティブエコシステムと統合および接続できることを意味します。
さらに、クラウドオブジェクトストア、データレイク、分散ファイルシステムなど、さまざまなソースからデータをロードしてパーティション化することもできます。
CodeFlareを使用して新しい機械学習プロジェクトを設定する主な利点はスピードです。 同社は、ユーザーの100,000人がCodeFlareを適用して15のパイプラインを分析および最適化し、機械学習モデルをトレーニングすると、それぞれの実行時間がXNUMX時間からわずかXNUMX分に短縮されたと主張しました。
スピードは重要です、IBMは説明しました、 データセットがどんどん大きくなっているため、機械学習ワークフローはますます複雑になっています。 そのため、研究者は、物事を成し遂げる前に、設定の構成により多くの時間を費やしています。
「IBMは、オープンソースのCodeFlareをデータワーカーと開発者が任意のクラウドで実行できる人工知能モデルを構築するためのフレームワークとして使用することでこれを追求しています」とMueller氏は述べています。 「CodeFlareはRedHatOpenShiftで実行され、そこからマルチクラウド機能を実現します。」
IBMは次のように述べています。
CodeFlareは本日オープンソースになり、GitHubのIBMリポジトリーで利用できるようになります。さらに、CodeFlareが作成し、IBMCloudおよびRedHatOpenShiftで実行されるCodeFlareパイプラインのサンプルもいくつかリリースされます。
最後に あなたがそれについてもっと知りたいのなら またはCodeFlareのソースコードを確認できる場合は、 次のリンクから.