La nova era ARM: el que ens espera ...

Logo ARM

Si et arriben a dir fa uns anys que un supercomputador amb xips basats en la ISA ARM anaven a ocupar la primera posició de l' TOP500 (Llista de les 500 supercomputadores més potents de món), els riures i riallades haguessin estat sonores. Ningú s'imaginava que una arquitectura que pràcticament no s'usava arribaria allà.

A poc a poc els xips ARM han anat guanyant terreny, conquistant el terreny dels dispositius mòbils per la seva eficiència i rendiment, així com molts altres productes encastats. Però ja fa uns anys es van començar a crear alguns servidors amb ARM de baix consum, i es va començar a coquetejar amb aquesta ISA en el sector HPC (High Performance Computing).

La notícia que va saltar recentment sobre que Apple abandona Intel per crear els seus propis xips basats en ARM era important, per tot el que suposa, però va passar gairebé desapercebuda per una altra notícia molt més important. I és que un supercomputador ARM va poder batre el rendiment de l'IBM Summit i conquerir la primera posició de la llista Top500. Per primera vegada un ARM arriba tan alt, i això ha suposat un abans i un després ...

No és desencertada la idea que ha portat a l' projecte EPI a crear futurs processadors ARM per a la no dependència tecnològica de el sector HPC d'Europa amb acceleradors RISC-V.

Tornant al d'Apple, semblava estrany que un xip ARM pogués superar en eficiència i rendiment als d'Intel, però Apple s'ho ha proposat i podrà fer dissenys molt interessants. Intel cada vegada ho té més complicat, I no només per la competència d'AMD ...

el supercomputador

supercomputador Fogaku

Però el que mai s'imaginaria fa temps és que també puguin coronar-se al HPC. Vols conèixer més detalls? Doncs bé, a la llista Top500 de juny de 2020, el primer lloc de rendiment el té el supercomputador Fugaku japonès. Un supercomputador basat en xips Fujitsu A64FX 48C a 2.2GHz, dels quals incorpora 7.299.072 nuclis de procesameinto per sumar una bestialitat de rendiment de càlcul en coma flotant.

concretament arriba als 415,5 PFLOPS (És a dir, 415.500.000.000.000.000 d'operacions de càlcul amb decimals per segon) i es farà servir per a la investigació contra la SARS-CoV-2, entre altres coses.

Està instal·lat al centre de computació RIKEN de Kobe, Japó. En aquest centre de dades s'han instal·lat els seus més de 150K nodes dels quals es compon, interconnectats mitjançant una xarxa d'alta velocitat Tofu Interconect D per enllaçar els xips ARMv8.2-A SVE de 52.cores per node.

A més fa servir memòria de gran ample de banda HBM2 amb una capacitat de 32 GiB per node. Pel que fa a l'emmagatzematge, té 1.6 TB NVMe compartida per cada 16 nodes, així com 150 PB Shared FS, i servei addicional d'emmagatzematge en el núvol.

Com a sistema operatiu utilitza Linux, Concretament la distribució RHEL 8, així com un IHK / McKernel de forma simultània. Totes les simulacions de rendiment van ser mesures sota McKernel, tot i que Linux està present per proveir de la resta de serveis POSIX.

el xip

xip Fujitsu A64FX

La bèstia de processament que ha donat aquestes xifres és bastant «humil». Es tracta d'un xip creat per Fujitsu. Es diu A64FX i és un microprocessador basat en l'arquitectura ARM 8.2a, adoptant també SVE (Scalable Vector Extensions), unes extensions addicionals a aquesta ISA base per aconseguir millors resultats de càlcul.

L'A64FX que ha dissenyat Fujitsu reemplaça així als seus anteriors xips per HPC basats en SPARC. I no només han marcat una fita per portar a l'Fugaku a la primera posició de l'Top500, també per ser els primers a suportar SIMD SVE de 512 bits.

Aquests xips han estat fabricats a les factories de TSMC, Les mateixes on fabriquen els Zen d'AMD, i les mateixes on fabricaran el futur xip d'Europa. La tecnologia que han fet servir tecnologia de 7nm per construir els seus 8.786.000.000 de transistors. Tot això en un petit xip que només necessita 594 pins.

A més, cada processador utilitza 32 GB de memòria HBM2 amb un ample de banda de 1TB / s, Amb 16 carrils o lans PCIX per processador per connectar-los amb els acceleradors, com les GPGPUs i FPGAs.

Finalment, treballa a 2.2 Ghz i s'han sumat els suficients package per completar aquesta xifra de gairebé 7.3 de nuclis i gairebé 5 PB de memòria.


Deixa el teu comentari

La seva adreça de correu electrònic no es publicarà. Els camps obligatoris estan marcats amb *

*

*

  1. Responsable de les dades: AB Internet Networks 2008 SL
  2. Finalitat de les dades: Controlar l'SPAM, gestió de comentaris.
  3. Legitimació: El teu consentiment
  4. Comunicació de les dades: No es comunicaran les dades a tercers excepte per obligació legal.
  5. Emmagatzematge de les dades: Base de dades allotjada en Occentus Networks (UE)
  6. Drets: En qualsevol moment pots limitar, recuperar i esborrar la teva informació.

  1.   Luisi va dir

    És increïble el nivell de processament a què s'ha arribat i les futures aplicacions pràctiques que això comportarà. Ara mateix, quan estic introduint aquest comentari en la seva meravellosa pàgina, el xip que utilitza el meu equip d'escriptori és un Intel. Aquest Pc té 8 anys d'antiguitat, però encara espero em duri al menys 2 anys més, temps més que suficient perquè tots aquests progressos de supercomputació es portin no solament a el terreny de les Empreses sinó també a l'ámbitodoméstico.

  2.   Cesare va dir

    tinc 61 anys i quan els processadors RISC van començar a tenir problemes, perquè les fabricaven empreses relativament petites i poc mercadeig; sempre deia que algun dia pot canviar la seva sort i aquesta pogués ser la seva gran oportunitat

  3.   renec va dir

    Hauré de donar-li a l'Rasperry Pi per estar a la moda amb ARM.
    Impressionant màquina, esperem que l'ús en el modelatge de la Covid en aquest supercomputador lliuri resultats.

  4.   Miguel va dir

    Si fos possible m'agradaria una comparativa de potència d'aquest processador amb els comercials. Encara que sigui a partir de dividir petaflops. Sobre 500 Gbflops estan els Ryzen 3600 o i510600. 415,5 PFLOPS / 150K nodes ~ = 415.500.000.000.000 / 150 = 2.770.000.000.000 => 2.770 gigaflops per node.
    415.500.000.000.000 / 150
    És a dir més de x5 dels actuals processadors X86 de consum més venuts.

    El que implica que es podrien oferir ordinadors personals ARM amb GNU - o Chromebooks - més potents - i probablement barates - que les alterantivas X86.

    De treballar jo en Valve, ja estaria creant una versió de Steam per arm - Chromebooks ja hi ha - fins i tot preguntant per si de cas fer una Steam Machine bona bonica i barata amb aquest processador o una versió una mica més barata.

    GIGA 9 / TERA 12 / PETA 15 (zeros)

  5.   Exteven va dir

    En el seu moment AMD «posar a Intel en serioses dificultats». Transmeta i els seus Crusoe també semblava que posaven a Intel en «serioses dificultats». I no fa tant, els PowerPC eren la pera llimonera i Intel anava a desaparèixer (discurs maquero que va canviar com si mai hagués existit quan Apple es va passar als Pentium).
    Tothom sembla oblidar que:
    1. Intel té la millor fundació de semiconductors de el món.
    2. Intel pot permetre els millors enginyers de l'món.
    3. Intel té en un calaix llicències d'ARM. El dia que li doni la gana, pot embolicar-se a fabricar ARM encara de més qualitat del que es fa avui dia i folrar-se. I si li cal, comprarà les llicències necessàries.
    Així que no, tindrem Intel per estona.

    1.    Jorgeneitor va dir

      Correcte. El meu corazoncillo és blau ... jo vot per Intel.