Die neue ARM-Ära: Was erwartet uns ...

ARM-Logo

Wenn Ihnen vor ein paar Jahren gesagt wurde, dass ein Supercomputer mit Chips auf basiert der ISA ARM sie würden die erste Position der einnehmen TOP500 (Liste der 500 leistungsstärksten Supercomputer der Welt), das Lachen und Lachen wäre laut gewesen. Niemand hätte gedacht, dass eine Architektur, die praktisch nicht genutzt wurde, dorthin gelangen würde.

Nach und nach haben ARM-Chips an Boden gewonnen und das Terrain mobiler Geräte hinsichtlich ihrer Effizienz und Leistung sowie vieler anderer eingebetteter Produkte erobert. Aber schon vor ein paar Jahren begannen sie zu kreieren Einige Server mit ARM geringer Verbrauch und begann mit diesem ISA im HPC-Sektor (High Performance Computing) zu flirten.

Die Nachrichten, die kürzlich darüber sprangen Apple gibt Intel auf Es war wichtig, eigene ARM-basierte Chips zu entwickeln, bei allem, was dazu gehört, aber es blieb von anderen, viel wichtigeren Neuigkeiten fast unbemerkt. Und es ist so, dass ein ARM-Supercomputer die Leistung des IBM Summit übertreffen und die erste Position der Top500-Liste erobern könnte. Zum ersten Mal erreicht ein ARM so viel, und das bedeutet ein Vorher und Nachher ...

Die Idee, die zum EPI-Projekt zukünftige ARM-Prozessoren für die technologische Unabhängigkeit des HPC-Sektors in Europa mit RISC-V-Beschleunigern zu schaffen.

Zurück zu Apple schien es seltsam, dass ein ARM-Chip die von Intel in Bezug auf Effizienz und Leistung übertreffen könnte, aber Apple hat dies vorgeschlagen und wird in der Lage sein, sehr interessante Designs zu erstellen. Intel wird immer komplizierterund das nicht nur wegen der Konkurrenz von AMD ...

Der Supercomputer

Fogaku Supercomputer

Aber was Sie sich vor langer Zeit nie vorstellen würden, ist das kann auch am HPC gekrönt werden. Möchten Sie mehr Details wissen? Nun, in der Top500-Liste für Juni 2020 hält der japanische Supercomputer Fugaku den Spitzenplatz. Ein Supercomputer, der auf 64 GHz Fujitsu A48FX 2.2C-Chips basiert, von denen er 7.299.072 Prozessorkerne enthält, um eine Bestie an Gleitkomma-Rechenleistung hinzuzufügen.

Speziell erreicht 415,5 PFLOPS (dh 415.500.000.000.000.000 Berechnungen mit Dezimalstellen pro Sekunde) und wird unter anderem für die Forschung gegen SARS-CoV-2 verwendet.

Es wird im RIKEN Computing Center in Kobe, Japan, installiert. In diesem Rechenzentrum sind ihre mehr als 150K Knoten Daraus besteht es, das über ein Hochgeschwindigkeits-Tofu Interconect D-Netzwerk miteinander verbunden ist, um die ARMv8.2-A-SVE-Chips mit 52 Kernen pro Knoten zu verbinden.

Benutze auch Speicher HBM2 mit hoher Bandbreite und einer Kapazität von 32 GiB pro Knoten. In Bezug auf den Speicher verfügt es über 1.6 TB NVMe, das pro 16 Knoten gemeinsam genutzt wird, sowie 150 PB Shared FS und einen zusätzlichen Cloud-Speicherdienst.

Als Betriebssystem benutze Linux, insbesondere die RHEL 8-Distribution sowie gleichzeitig ein IHK / McKernel. Alle Leistungssimulationen wurden unter McKernel gemessen, obwohl Linux vorhanden ist, um den Rest der POSIX-Dienste bereitzustellen.

Der Chip

Fujitsu A64FX Chip

Das verarbeitende Tier, das diese Zahlen hervorgebracht hat, ist ziemlich "bescheiden". Es ist ein Chip von Fujitsu. Es heißt A64FX und es ist ein Mikroprozessor, der auf der ARM 8.2A-Architektur basiert und auch SVE (Scalable Vector Extensions) verwendet, zusätzliche Erweiterungen für diese Basis-ISA, um bessere Berechnungsergebnisse zu erzielen.

Der A64FX, der hat Fujitsu entworfen Damit ersetzt es seine bisherigen SPARC-basierten HPC-Chips. Und sie haben nicht nur einen Meilenstein gesetzt, um den Fugaku an die Spitze der Top500 zu bringen, sondern auch, um als erste 512-Bit-SIMD-EFD zu unterstützen.

Diese Chips wurden in hergestellt TSMC-Fabrikendas gleiche, wo sie den Zen von AMD herstellen, und das gleiche, wo sie den zukünftigen Chip von Europa herstellen werden. Die Technologie, mit der sie ihre 7 Transistoren mit 8.786.000.000-nm-Technologie gebaut haben. All das in einem kleinen Chip, der nur 594 Pins benötigt.

Zusätzlich verwendet jeder Prozessor 32 GB HBM2-Speicher mit einem 1 TB / s Bandbreitemit 16 Lanes oder PCIx-Lanes pro Prozessor, um sie mit Beschleunigern wie GPGPUs und FPGAs zu verbinden.

Schließlich arbeitet bei 2.2 GHz und es wurden genügend Pakete hinzugefügt, um diese Zahl von fast 7.3 Millionen Kernen und fast 5 PB Speicher zu vervollständigen.


Hinterlasse einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert mit *

*

*

  1. Verantwortlich für die Daten: AB Internet Networks 2008 SL
  2. Zweck der Daten: Kontrolle von SPAM, Kommentarverwaltung.
  3. Legitimation: Ihre Zustimmung
  4. Übermittlung der Daten: Die Daten werden nur durch gesetzliche Verpflichtung an Dritte weitergegeben.
  5. Datenspeicherung: Von Occentus Networks (EU) gehostete Datenbank
  6. Rechte: Sie können Ihre Informationen jederzeit einschränken, wiederherstellen und löschen.

  1.   Ludwig sagte

    Das erreichte Verarbeitungsniveau und die damit verbundenen zukünftigen praktischen Anwendungen sind unglaublich. Im Moment, wenn ich diesen Kommentar auf Ihre wundervolle Seite stelle, ist der Chip, den mein Desktop verwendet, ein Intel. Dieser PC ist 8 Jahre alt, aber ich hoffe immer noch, dass er noch mindestens 2 Jahre hält, mehr als genug Zeit, um all diese Fortschritte im Bereich Supercomputing nicht nur auf den Bereich der Unternehmen, sondern auch auf das häusliche Umfeld zu übertragen.

  2.   Caesar sagte

    Ich bin 61 Jahre alt und als die RISC-Prozessoren anfingen, Probleme zu haben, weil sie von relativ kleinen Unternehmen und wenig Marketing hergestellt wurden; Er sagte immer, dass sich eines Tages sein Glück ändern könnte und dies seine große Chance sein könnte

  3.   Reneco sagte

    Ich muss den Rasperry Pi treffen, um mit ARM cool zu sein.
    Wir hoffen, dass die Verwendung bei der Modellierung des Covid in diesem Supercomputer zu beeindruckenden Ergebnissen führen wird.

  4.   Miguel sagte

    Wenn möglich, möchte ich einen Vergleich der Leistung dieses Prozessors mit den Werbespots. Auch wenn es sich um das Teilen von Petaflops handelt. Über 500 Gbflops sind die Ryzen 3600 oder i510600. 415,5 PFLOPS / 150k-Knoten ~ = 415.500.000.000.000 / 150 = 2.770.000.000.000 => 2.770 Gigaflops pro Knoten.
    415.500.000.000.000 / 150
    Das heißt, mehr als x5 der derzeit meistverkauften X86-Prozessoren für Endverbraucher.

    Dies bedeutet, dass ARM-PCs mit GNU - oder Chromebooks - angeboten werden könnten, die leistungsfähiger und wahrscheinlich billiger sind als die X86-Alternativen.

    Wenn ich bei Valve arbeite, würde ich bereits eine Version von Steam for Arm erstellen - es gibt bereits Chromebooks - und mich sogar fragen, ob ich mit diesem Prozessor eine gute, schöne und billige Steam-Maschine oder eine etwas billigere Version herstellen könnte.

    GIGA 9 / TERA 12 / PETA 15 (Nullen)

  5.   exteban sagte

    Zu seiner Zeit brachte AMD "Intel in große Schwierigkeiten". Transmeta und sein Crusoe schienen Intel ebenfalls in "ernsthafte Schwierigkeiten" zu bringen. Und vor nicht allzu langer Zeit waren die PowerPCs die Zitronenbirne und Intel würde verschwinden (Maquero-Diskurs, der sich änderte, als hätte er nie existiert, als Apple zum Pentium wechselte).
    Jeder scheint das zu vergessen:
    1. Intel hat die beste Halbleitergrundlage der Welt.
    2. Intel kann sich die besten Ingenieure der Welt leisten.
    3. Intel hat ARM-Lizenzen in einer Schublade. An jedem Tag, an dem Sie Lust dazu haben, können Sie sich bündeln, um ARMs von noch höherer Qualität als heute herzustellen, und viel Geld verdienen. Und wenn Sie es brauchen, kaufen Sie die notwendigen Lizenzen.
    Also nein, wir werden Intel für eine Weile haben.

    1.    Jörgeneitor sagte

      Richtig. Mein kleines Herz ist blau ... Ich stimme für Intel.