新しいARM時代:私たちを待っているもの...

ARMロゴ

数年前に、チップを搭載したスーパーコンピューターが ISA ARM 彼らはの最初の位置を占めるつもりでした TOP500 (世界で最も強力な500台のスーパーコンピューターのリスト)、笑いと笑い声は大きかったでしょう。 実際に使用されていないアーキテクチャがそこに到達するとは誰も想像していませんでした。

ARMチップは少しずつ進歩し、モバイルデバイスの効率とパフォーマンス、およびその他の多くの組み込み製品の領域を征服しています。 しかし、数年前に彼らは作成し始めました ARMを搭載した一部のサーバー 低消費であり、HPC(ハイパフォーマンスコンピューティング)セクターでこのISAを使用し始めました。

それについて最近急上昇したニュース AppleはIntelを放棄する 独自のARMベースのチップを作成することは、それに伴うすべてのことにとって重要でしたが、他のはるかに重要なニュースにはほとんど気づかれていませんでした。 そして、ARMスーパーコンピューターがIBMサミットのパフォーマンスを上回り、Top500リストの最初の位置を征服する可能性があるということです。 初めてARMが非常に高くなり、それは前後を意味しました...

につながったアイデア EPIプロジェクト RISC-Vアクセラレータを使用して、ヨーロッパのHPCセクターの技術的非依存性のための将来のARMプロセッサを作成します。

Appleに戻ると、ARMチップが効率とパフォーマンスでIntelを凌駕する可能性があるのは奇妙に思えましたが、Appleはそれを提案しており、非常に興味深いデザインを作成できるようになります。 インテルはますます複雑になっています、そしてAMDとの競争のためだけではありません...

スーパーコンピューター

フォガクスーパーコンピューター

しかし、あなたがずっと前に想像もしなかったことはそれです HPCで戴冠することもできます。 詳細を知りたいですか? さて、500年2020月のTop64リストでは、日本のスーパーコンピューター富岳がトップパフォーマンススポットを占めています。 48GHzのFujitsuA2.2FX 7.299.072Cチップをベースにしたスーパーコンピューターで、XNUMX個のプロセッシングコアを組み込んで、浮動小数点コンピューティングパフォーマンスの獣を追加します。

具体的には 415,5PFLOPSに達する (つまり、415.500.000.000.000.000秒あたりの小数で2の計算)、特にSARS-CoV-XNUMXに対する研究に使用されます。

神戸の理研コンピューティングセンターに設置されています。 このデータセンターでは、 150Kノード その構成要素であり、高速Tofu Interconect Dネットワークを介して相互接続され、ノードあたり8.2コアのARMv52-ASVEチップをリンクします。

また使用する メモリ ノードあたり2GiBの容量を持つ高帯域幅HBM32。 ストレージに関しては、1.6ノードあたり16 TBのNVMe、150 PBの共有FS、および追加のクラウドストレージサービスがあります。

オペレーティングシステムとして Linuxを使用する特に、RHEL 8ディストリビューションと、IHK / McKernelを同時に使用します。 Linuxは残りのPOSIXサービスを提供するために存在しますが、すべてのパフォーマンスシミュレーションはMcKernelの下で測定されました。

チップ

富士通A64FXチップ

それらの数字を生み出した加工獣はかなり「謙虚」です。 富士通が作成したチップです。 それはA64FXと呼ばれています また、ARM 8.2Aアーキテクチャに基づくマイクロプロセッサであり、SVE(Scalable Vector Extensions)も採用しています。これは、より優れた計算結果を実現するために、そのベースISAに追加された拡張機能です。

持っているA64FX 富士通が設計した したがって、以前のSPARCベースのHPCチップに取って代わります。 そして、彼らは富岳をTop500のトップに引き上げるだけでなく、512ビットSIMDEVSを最初にサポートするためのマイルストーンを設定しました。

これらのチップはで製造されています TSMCファクトリー、AMDのZenを製造する場所と同じであり、ヨーロッパの将来のチップを製造する場所も同じです。 彼らが7nm技術を使用して8.786.000.000個のトランジスタを構築した技術。 これらはすべて、594ピンしか必要としない小さなチップに収められています。

さらに、各プロセッサは32GBのHBM2メモリを使用します。 1TB /秒の帯域幅、GPGPUやFPGAなどのアクセラレータと接続するためのプロセッサあたり16レーンまたはPCIxレーン。

最後に、 2.2GHzで動作します そして、ほぼ7.3万コアとほぼ5PBのメモリという数字を完成させるのに十分なパッケージが追加されました。


コメントを残す

あなたのメールアドレスが公開されることはありません。 必須フィールドには付いています *

*

*

  1. データの責任者:AB Internet Networks 2008 SL
  2. データの目的:SPAMの制御、コメント管理。
  3. 正当化:あなたの同意
  4. データの伝達:法的義務がある場合を除き、データが第三者に伝達されることはありません。
  5. データストレージ:Occentus Networks(EU)がホストするデータベース
  6. 権利:いつでも情報を制限、回復、削除できます。

  1.   ルイージ

    達成された処理のレベルとこれが伴う将来の実用的なアプリケーションは信じられないほどです。 今、私があなたの素晴らしいページにこのコメントを書いているとき、私のデスクトップコンピュータが使用しているチップはIntelです。 このPCは8年前のものですが、それでも少なくとも2年は続くことを願っています。これは、これらすべてのスーパーコンピューティングの進歩が企業の分野だけでなく国内の領域にも伝わるのに十分な時間です。

  2.   チェーザレ

    私は61歳で、RISCプロセッサが問題を抱え始めたのは、比較的小さな会社で製造されていて、マーケティングがほとんどなかったためです。 彼はいつも彼の運が変わるかもしれないと言いましたそしてこれは彼の素晴らしい機会かもしれません

  3.   レネコ

    ARMに合わせてRasperryPiを提供する必要があります。
    印象的なマシンです。このスーパーコンピューターでのCovidのモデリングでの使用が結果をもたらすことを期待しましょう。

  4.   ミゲル

    可能であれば、このプロセッサーのパワーとコマーシャルのパワーを比較したいと思います。 ペタフロップスの分割によるものであっても。 500 Gbflopsを超えるのは、Ryzen3600またはi510600です。 415,5 PFLOPS / 150kノード〜= 415.500.000.000.000 / 150 = 2.770.000.000.000 =>ノードあたり2.770ギガフロップス。
    415.500.000.000.000 / 150
    つまり、現在最も売れているコンシューマーX5プロセッサーの86倍以上です。

    これは、ARMパーソナルコンピュータがX86の代替品よりもGNU(またはChromebook)で提供され、より強力で、おそらくより安価であることを意味します。

    私がValveで働いている場合、私はすでにarm用のSteamのバージョンを作成しているでしょう-Chromebookはすでに存在します-そのプロセッサで良い、素敵で安いSteamマシンを作ることができるのか、それともやや安いバージョンを作ることができるのか疑問に思っています。

    GIGA 9 / TERA 12 / PETA 15(ゼロ)

  5.   エクステバン

    当時、AMDは「Intelを深刻な問題に陥らせた」。 Transmetaと彼のCrusoeも、Intelを「深刻な問題」に陥らせているようでした。 そして少し前までは、PowerPCはレモンナシであり、Intelは姿を消そうとしていました(AppleがPentiumに切り替えたときに存在しなかったかのように変化したMaqueroの談話)。
    誰もがそれを忘れているようです:
    1.インテルは世界で最高の半導体基盤を持っています。
    2.インテルは、世界最高のエンジニアを雇うことができます。
    3.インテルはドロワーにARMライセンスを持っています。 いつでも好きなときにバンドルして、現在製造されているものよりもさらに高品質のARMを作成し、多くのお金を稼ぐことができます。 また、必要に応じて、必要なライセンスを購入します。
    いいえ、しばらくの間Intelを使用します。

    1.    ヨルゲナイター

      正しい。 私の小さな心は青いです...私はインテルに投票します。