La nouvelle ère ARM: ce qui nous attend ...

BRAS logo

Si on vous disait il y a quelques années qu'un supercalculateur avec des puces basées sur le bras ISA devaient occuper la première position du TOP500 (liste des 500 supercalculateurs les plus puissants du monde), les rires et les rires auraient été forts. Personne n'imaginait qu'une architecture pratiquement inutilisée y parviendrait.

Petit à petit, les puces ARM gagnent du terrain, conquérant le terrain des appareils mobiles pour leur efficacité et leurs performances, ainsi que de nombreux autres produits embarqués. Mais il y a quelques années, ils ont commencé à créer certains serveurs avec ARM faible consommation, et a commencé à flirter avec cet ISA dans le secteur HPC (High Performance Computing).

Les nouvelles qui ont sauté récemment à ce sujet Apple abandonne Intel Créer ses propres puces basées sur ARM était important, pour tout ce que cela implique, mais cela est passé presque inaperçu par d'autres nouvelles beaucoup plus importantes. Et c'est qu'un supercalculateur ARM pourrait battre les performances de l'IBM Summit et conquérir la première position de la liste Top500. Pour la première fois, un bras atteint si haut, et cela a signifié un avant et un après ...

L'idée qui a conduit à la Projet PEV créer de futurs processeurs ARM pour la non-dépendance technologique du secteur HPC en Europe avec des accélérateurs RISC-V.

Pour en revenir à Apple, il semblait étrange qu'une puce ARM puisse surpasser celles d'Intel en efficacité et en performances, mais Apple l'a proposée et pourra faire des designs très intéressants. Intel devient de plus en plus compliqué, et pas seulement à cause de la concurrence d'AMD ...

Le supercalculateur

Supercalculateur Fogaku

Mais ce que tu n'imaginerais jamais il y a longtemps, c'est que peut également être couronné au HPC. Voulez-vous en savoir plus? Eh bien, sur la liste Top500 de juin 2020, la première place de performance est détenue par le supercalculateur japonais Fugaku. Un supercalculateur basé sur des puces 64Ghz Fujitsu A48FX 2.2C, dont il intègre 7.299.072 XNUMX XNUMX cœurs de traitement pour ajouter une bête de performances de calcul en virgule flottante.

Spécifiquement atteint 415,5 PFLOPS (soit 415.500.000.000.000.000 calculs avec décimales par seconde) et sera utilisé pour la recherche contre le SRAS-CoV-2, entre autres.

Il est installé au RIKEN Computing Center à Kobe, au Japon. Dans ce centre de données, plus de 150 XNUMX nœuds dont il est composé, interconnecté via un réseau Tofu Interconect D haut débit pour relier les puces ARMv8.2-A SVE de 52 cœurs par nœud.

Utiliser aussi mémoire HBM2 haut débit avec une capacité de 32 Gio par nœud. En ce qui concerne le stockage, il dispose de 1.6 To NVMe partagé par 16 nœuds, ainsi que de 150 PB Shared FS et d'un service de stockage cloud supplémentaire.

En tant que système d'exploitation utiliser linux, en particulier la distribution RHEL 8, ainsi qu'un IHK / McKernel simultanément. Toutes les simulations de performances ont été mesurées sous McKernel, bien que Linux soit présent pour fournir le reste des services POSIX.

La puce

Puce Fujitsu A64FX

La bête de transformation qui a donné ces chiffres est assez «humble». C'est une puce créée par Fujitsu. Il s'appelle A64FX et c'est un microprocesseur basé sur l'architecture ARM 8.2A, adoptant également SVE (Scalable Vector Extensions), des extensions supplémentaires à cette base ISA pour obtenir de meilleurs résultats de calcul.

L'A64FX qui a Fujitsu conçu il remplace ainsi ses anciennes puces HPC basées sur SPARC. Et ils ont non seulement fixé un jalon pour amener le Fugaku au sommet du Top500, mais aussi pour être le premier à prendre en charge SIMD EVS 512 bits.

Ces puces ont été fabriquées en Usines TSMC, le même où ils fabriquent le Zen d'AMD, et le même où ils fabriqueront la future puce d'Europe. La technologie qu'ils ont utilisée la technologie 7 nm pour construire leurs 8.786.000.000 594 XNUMX XNUMX transistors. Tout cela dans une petite puce qui n'a besoin que de XNUMX broches.

De plus, chaque processeur utilise 32 Go de mémoire HBM2 avec un Bande passante de 1 To / s, avec 16 voies ou voies PCIx par processeur pour les connecter à des accélérateurs, tels que des GPGPU et des FPGA.

Enfin, fonctionne à 2.2 Ghz et suffisamment de packages ont été ajoutés pour compléter ce chiffre de près de 7.3 millions de cœurs et près de 5 Po de mémoire.


6 commentaires, laissez le vôtre

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont marqués avec *

*

*

  1. Responsable des données : AB Internet Networks 2008 SL
  2. Finalité des données: Contrôle du SPAM, gestion des commentaires.
  3. Légitimation: votre consentement
  4. Communication des données: Les données ne seront pas communiquées à des tiers sauf obligation légale.
  5. Stockage des données: base de données hébergée par Occentus Networks (EU)
  6. Droits: à tout moment, vous pouvez limiter, récupérer et supprimer vos informations.

  1.   Louis dit

    Le niveau de traitement qui a été atteint et les futures applications pratiques que cela entraînera sont incroyables. En ce moment, lorsque je mets ce commentaire sur votre merveilleuse page, la puce que mon bureau utilise est une puce Intel. Ce PC a 8 ans, mais j'espère toujours qu'il durera au moins 2 ans de plus, plus que suffisamment de temps pour que toutes ces avancées du supercalculateur soient portées non seulement dans le domaine des entreprises mais aussi dans l'environnement domestique.

  2.   Cesare dit

    J'ai 61 ans et quand les processeurs RISC ont commencé à avoir des problèmes, parce qu'ils étaient fabriqués par des entreprises relativement petites et peu commercialisées; Il a toujours dit qu'un jour sa chance pourrait changer et que cela pourrait être sa grande opportunité

  3.   Renéco dit

    Je vais devoir donner au Rasperry Pi pour être à la mode avec ARM.
    Machine impressionnante, espérons que l'utilisation dans la modélisation du Covid dans ce supercalculateur donnera des résultats.

  4.   Miguel dit

    Si possible, je voudrais une comparaison de la puissance de ce processeur avec les publicités. Même si c'est en divisant les pétaflops. Plus de 500 Gbflops sont les Ryzen 3600 ou i510600. 415,5 PFLOPS / 150k nœuds ~ = 415.500.000.000.000 / 150 = 2.770.000.000.000 => 2.770 XNUMX gigaflops par nœud.
    415.500.000.000.000 / 150
    Autrement dit, plus de x5 des processeurs X86 grand public les plus vendus actuellement.

    Ce qui implique que les ordinateurs personnels ARM pourraient être proposés avec GNU - ou Chromebooks - plus puissants - et probablement moins chers - que les alternatives X86.

    Si je travaille chez Valve, je créerais déjà une version de Steam for Arm - les chromebooks existent déjà - même en me demandant si je pourrais faire une bonne, belle et bon marché Steam Machine avec ce processeur ou une version un peu moins chère.

    GIGA 9 / TERA 12 / PETA 15 (zéros)

  5.   Extéban dit

    En son temps, AMD «a mis Intel en difficulté». Transmeta et son Crusoe semblaient également mettre Intel en «sérieux ennuis». Et il n'y a pas si longtemps, les PowerPC étaient la citronnelle et Intel allait disparaître (discours de Maquero qui a changé comme s'il n'avait jamais existé lorsque Apple est passé au Pentium).
    Tout le monde semble oublier que:
    1. Intel possède la meilleure base de semi-conducteurs au monde.
    2. Intel peut se permettre les meilleurs ingénieurs du monde.
    3. Intel a des licences ARM dans un tiroir. Chaque jour que vous en avez envie, vous pouvez vous regrouper pour fabriquer des ARM de meilleure qualité que ce qui est fabriqué aujourd'hui et gagner beaucoup d'argent. Et si vous en avez besoin, vous achèterez les licences nécessaires.
    Donc non, nous aurons Intel pendant un certain temps.

    1.    Jorgénior dit

      C'est Correct. Mon petit cœur est bleu ... Je vote pour Intel.