Intel ha annunciato nei giorni scorsi sia la disponibilità nuovi processori Xeon Scalable di quarta generazione (nome in codice Sapphire Rapids) a oltre un anno dal loro annuncio, sia nuovi processori CPU Max e GPU Max con memoria ad alta larghezza di banda (HBM) orientati verso il calcolo ad alte prestazioni (HPC), il supercomputing e l’intelligenza artificiale (AI).

I primi, disponibili formalmente a partire da gennaio 2023 ma di fatto già ora nelle mani di partner e OEM, hanno rappresentato per Intel una sfida non tanto nella progettazione ma nella produzione. Questa è infatti la prima generazione di chip con processo produttivo Intel 7, un design avanzato a 10 nm che ha richiesto anni per essere messo a punto.

Gli Xeon Scalable di quarta generazione sono processori a dir poco ambiziosi dotati di una nuova microarchitettura, fino a 60 core per chip e supporto per memoria DDR5, PCI Express Gen 5, CXL 1.1 e memoria HBM2E. Inoltre, portano con sé speciali acceleratori che non si erano mai visti prima negli Xeon. Questi includono:

  • Advanced Matrix Extensions (AMX): istruzioni x86 specifiche per AI
  • Dynamic Load Balancer (DLB): fornisce il bilanciamento del carico e la pianificazione tra i core della CPU.
  • Intel Data Streaming Accelerator (DSA): riduce il consumo energetico e i colli di bottiglia durante lo spostamento di set di dati di grandi dimensioni.
  • Intel In-Memory Analytics Accelerator (IAA): comprime e decomprime i dati in memoria quando vengono spostati, riducendo l’utilizzo della memoria.
  • Intel QuickAssist Technology (QAT): accelera le attività di crittografia e compressione, accelerando le funzioni di sicurezza.

Per quanto riguarda invece il secondo annuncio di Intel, si parla della serie Xeon CPU Max e della serie GPU Max, entrambe previste sul mercato a inizio 2023. I chip sono basati sulla tecnologia esistente: la CPU è proprio uno Xeon Scalable di cui abbiamo appena parlato, mentre la GPU ha come nome in codice Ponte Vecchio ed è la versione data center della tecnologia GPU Xe di Intel. I due processori sono dotati di HBM sul die del processore in modo da non fare affidamento solo sulla DRAM standard. HBM è considerevolmente più veloce della memoria DDR4 o DDR5 e si trova sul die del processore proprio accanto al core CPU/GPU con un’interconnessione ad alta velocità, piuttosto che su memory stick come la memoria DDR.

data center

CPU Max

CPU Max è disponibile in tre configurazioni server. La prima è senza DRAM e quindi l’unica memoria nel sistema è rappresentata da 64GB di HBM sul chip CPU Max. È così che funziona il supercomputer giapponese Fugaku, uno dei più veloci al mondo. In un sistema a due socket si hanno così a disposizione 128 GB di memoria, quantità sufficiente per molte applicazioni e carichi di lavoro. In questo scenario di utilizzo, le applicazioni possono essere eseguite senza modifiche.

La seconda configurazione è chiamata modalità flat HBM e combina HBM nel pacchetto CPU con memory stick DDR5 standard nel sistema. Con HBM e DDR il software deve essere invece ottimizzato per spostare i dati tra queste diverse regioni di memoria. La terza configurazione è la modalità di memorizzazione nella cache HBM, in cui la HBM funge da cache per la memoria DDR nel sistema. In questa modalità, non sono necessarie modifiche al codice software.

GPU Max

Anche GPU Max è disponibile in tre configurazioni: 1100, 1350 e 1550. La 1100 è una scheda PCIe double-wide da 300 Watt con 56 core Xe e 48GB di memoria HBM2e. È possibile collegare più schede tramite bridge Intel Xe Link. Le altre due configurazioni utilizzano il modulo acceleratore Open Compute Project (OCP), noto come OAM, ovvero un’interfaccia alternativa più veloce alle schede PCIe. La GPU 1350 è un modulo OAM da 450 Watt con 112 core Xe e 96GB di HBM, mentre la GPU 1550 è un modulo OAM da 600 Watt con 128 core Xe e 128GB di HBM.

La scheda PCI Express è ottima per l’uso in un server standard e nei sistemi workstation, mentre i moduli OAM sono orientati ad ambienti a densità più elevata. Intel, che ha annunciato la disponibilità dei primi server con OAM a partire dal prossimo anno, sta costruendo un supercomputer per l’Argonne National Lab proprio con processori CPU Max e GPU Max che, quando sarà attivo nel 2023, supererà i 2 exaFLOP di prestazioni. Si tratta del doppio della velocità di Frontier, l’attuale leader nella classifica globale dei supercomputer. McVeigh ha detto che è la combinazione dei due processori che lo rende possibile.