NVIDIA ha presentato al Supercomputing 23 la prossima ondata di tecnologie di supercomputing che porteranno i centri di ricerca scientifica e industriale di tutto il mondo a nuovi livelli di prestazioni ed efficienza energetica. “Le innovazioni hardware e software di NVIDIA stanno creando una nuova classe di supercomputer IA” ha dichiarato Ian Buck, vicepresidente della divisione high performance computing e hyperscale data center dell’azienda.

Di seguito i principali annunci.

  • DGX GH200: una nuova classe di supercomputer IA con 256 superchip Grace Hopper e sistema di switch NVLink. Questo supercomputer è in grado di fornire 1 exaflop di prestazioni e 144 terabyte di memoria condivisa, ideale per sviluppare LLM per applicazioni di intelligenza artificiale generativa, sistemi di raccomandazione e analisi dei dati.
  • GH200 Grace Hopper: superchip che combina una CPU basata su Arm NVIDIA Grace con una GPU NVIDIA H100 Tensor Core nello stesso package, usando gli interconnettori NVLink-C2C. Questo superchip elimina la necessità di una connessione PCIe tradizionale tra CPU e GPU, aumentando la larghezza di banda tra GPU e CPU di 7 volte rispetto alla tecnologia PCIe più recente e riducendo il consumo di energia dell’interconnessione di oltre 5 volte.
  • Sistema di switch NVLink: una nuova interconnessione che consente a tutte le GPU in un sistema DGX GH200 di lavorare insieme come una sola. Il sistema di switch NVLink fornisce 48 volte più larghezza di banda NVLink rispetto alla generazione precedente, offrendo la potenza di un supercomputer IA massivo con la semplicità di programmazione di una singola GPU. Google Cloud, Meta e Microsoft sono tra i primi che avranno accesso al DGX GH200 per esplorare le sue capacità per i carichi di lavoro di intelligenza artificiale generativa. NVIDIA ha anche intenzione di fornire il design del DGX GH200 come modello ai fornitori di servizi cloud e ad altri hyperscaler in modo che possano personalizzarlo ulteriormente per la loro infrastruttura.

nvidia 1

  • Collaborazioni: Nvidia ha annunciato una partership pluriennale con Microsoft per costruire uno dei supercomputer IA più potenti al mondo, alimentato dall’infrastruttura di supercomputing avanzata di Microsoft Azure combinata con le GPU, le reti e il software IA di NVIDIA. Questa collaborazione mira ad aiutare le imprese a formare, distribuire e scalare l’IA, inclusi i modelli di ultima generazione. La collaborazione con Tata Group fornirà invece infrastrutture e piattaforme di calcolo IA per lo sviluppo di soluzioni di intelligenza artificiale. Tata Group utilizzerà il supercomputer AI NVIDIA DGX A100 per creare un servizio di infrastruttura come servizio (IaaS) e una piattaforma per i servizi IA.
  • CPU Grace: una CPU progettata per i carichi di lavoro di intelligenza artificiale e di calcolo ad alte prestazioni. La CPU Grace utilizza l’architettura Arm e offre una larghezza di banda di memoria 10 volte superiore rispetto alle CPU x86 di oggi. La CPU Grace sarà utilizzata da CSCS e Los Alamos National Laboratory per costruire supercomputer Hewlett Packard Enterprise.
  • CUDA Quantum: un ambiente di programmazione per il calcolo quantistico ibrido basato sulle GPU NVIDIA. CUDA Quantum consente agli sviluppatori di scrivere programmi quantistici in Python e di eseguirli su simulatori quantistici accelerati dalle GPU o su dispositivi quantistici reali. CUDA Quantum è stato utilizzato da BASF per simulare l’equivalente di 24 qubit, mostrando come il calcolo quantistico possa aiutare a risolvere grandi sfide.