A quasi un anno dal suo annuncio al CES 2025, Nvidia porta finalmente sugli scaffali DGX Spark, la sua più piccola workstation AI erede diretta del concept Project Digits. Nonostante le dimensioni ridotte (paragonabili a quelle di un mini PC NUC), il nuovo sistema racchiude la potenza dell’architettura Grace-Blackwell, offrendo prestazioni molto elevate e un design pensato specificamente per sviluppatori IA, ricercatori e ingegneri di robotica.

Con un prezzo di partenza di circa 3.000 dollari, la DGX Spark è un punto d’ingresso nel calcolo IA professionale e una piattaforma economica rispetto ai sistemi DGX tradizionali, pur essendo in grado di gestire modelli da centinaia di miliardi di parametri.

Questo grazie al SoC GB10, una versione compatta del superchip Grace-Blackwell utilizzato nei rack NVL72 di fascia data center. Si tratta di un design complesso basato su due die di calcolo collegati tramite NVLink con una banda di 600 GB/s, la stessa tecnologia che Nvidia intende impiegare anche per collegare le proprie GPU ai futuri processori Intel.

Sul piano prestazionale, il GB10 raggiunge un petaFLOP di potenza FP4 sparsity o circa 31 teraFLOPS in FP32, valori che lo avvicinano a una GPU RTX 5070 in termini di pura capacità di calcolo. Tuttavia, la vera forza del sistema non risiede nella velocità grezza, bensì nella gestione della memoria. Il DGX Spark dispone infatti di 128 GB di memoria unificata LPDDR5x, condivisa tra CPU e GPU, con una banda di 273 GB/s. Questo approccio, simile a quello dei chip Apple M-series o degli AMD Strix Halo, elimina colli di bottiglia e massimizza la coerenza dei dati tra i componenti ed è in grado di gestire modelli fino a 200 miliardi di parametri.

Diversamente dal chip Grace originale, basato sui core Neoverse V2, il GB10 utilizza 20 core ARMv9.2 progettati in collaborazione con MediaTek. Dieci di questi core sono X925 ad alte prestazioni, mentre gli altri dieci appartengono alla gamma Cortex A725, più efficienti dal punto di vista energetico. Questa configurazione ibrida consente al sistema di bilanciare performance e consumi in base al tipo di carico, proprio come avviene nei moderni SoC per laptop o dispositivi mobili.

NVIDIA-GB10-Motherboard-Angle-1

L’intero sistema si basa su Ubuntu Linux personalizzato da Nvidia e non include Windows. DGX Spark non è infatti un Copilot+ PC o un sistema per l’uso quotidiano, ma una piattaforma di sviluppo ottimizzata per machine learning, inferenza e ottimizzazione di modelli IA.

Un’altra caratteristica che distingue il DGX Spark da qualsiasi altro mini PC è la rete integrata ConnectX-7 con doppia porta QSFP Ethernet. Oltre a fornire connettività da 200 Gbps, queste porte possono essere utilizzate per collegare due unità Spark in parallelo, creando un cluster compatto capace di raddoppiare la potenza di inferenza e fine-tuning. In questa configurazione, Nvidia dichiara la possibilità di eseguire modelli fino a 405 miliardi di parametri con precisione a 4 bit, una capacità straordinaria se si considera che il tutto avviene in un formato grande poco più di un libro.

Nvidia non sarà comunque l’unico brand a produrre la DGX Spark. A partire da oggi, il sistema sarà infatti disponibile anche tramite partner OEM come Acer, Asus, Dell Technologies, Gigabyte, HPE, Lenovo e MSI. Ogni produttore potrà adattare leggermente il design, ma l’hardware di base rimarrà quello definito da Nvidia, con il SoC GB10 al centro dell’architettura.

Il lancio della Spark precede l’arrivo della futura DGX Station con GPU Blackwell Ultra, destinata a diventare la workstation IA di punta di Nvidia. Fino a quel momento è però la Spark a rappresentare la soluzione con la più alta capacità di memoria disponibile nella linea workstation di Nvidia.