Per oltre tre decenni, Arm ha costruito il proprio successo su un modello fondato sulla progettazione di architetture e IP concessi in licenza. Con l’introduzione dell’Arm AGI CPU, per la prima volta l’azienda britannica entra direttamente nel mercato del silicio “production-ready”, proponendo una soluzione completa pensata per l’infrastruttura AI contemporanea. Un cambio di paradigma che riflette la crescente complessità dei sistemi distribuiti e la necessità di piattaforme immediatamente implementabili su larga scala.

Il contesto tecnologico in cui nasce l’AGI CPU è quello dell’AI agentica, un modello operativo in cui software autonomi coordinano attività, interrogano modelli multipli e prendono decisioni in tempo reale senza intermediazione umana. In questa configurazione, il limite non è più rappresentato dalla velocità di interazione dell’utente, ma dalla capacità dell’infrastruttura di sostenere carichi continui, altamente paralleli e distribuiti. È qui che la CPU torna a occupare un ruolo centrale come elemento che determina il ritmo complessivo del sistema.

All’interno di un data center AI moderno, il processore gestisce infatti una molteplicità di funzioni critiche tra coordinamento degli acceleratori, scheduling dei carichi, gestione della memoria e trasferimento dei dati tra nodi. Con l’avvento dell’AI agentica, queste responsabilità si amplificano ulteriormente, includendo la gestione simultanea di migliaia di agenti software che operano in parallelo. Uno scenario che impone requisiti nuovi in grado di andare oltre la semplice scalabilità lineare delle architetture tradizionali.

L’AGI CPU nasce su base Arm Neoverse, una piattaforma già adottata da diversi hyperscaler e operatori cloud. Dal punto di vista architetturale, il nuovo processore è progettato per operare in configurazioni rack-scale, dove la densità computazionale e l’efficienza energetica diventano parametri determinanti. Il design di riferimento prevede un modulo 1OU a doppio nodo, ciascuno dotato di CPU con memoria e I/O dedicati per un totale di 272 core per blade. In una configurazione standard raffreddata ad aria, un rack da 36 kW può ospitare fino a 30 blade, raggiungendo 8.160 core complessivi.

Questi numeri assumono un significato concreto solo se letti insieme alla capacità del sistema di mantenere prestazioni sostenute sotto carico continuo. A differenza di molte architetture tradizionali, dove l’aumento del numero di core porta a fenomeni di contesa sulle risorse, l’AGI CPU è infatti progettata per garantire un’elevata efficienza per thread anche in condizioni di saturazione. La combinazione tra ampia banda di memoria, core ad alte prestazioni e ottimizzazione dei percorsi dati consente di massimizzare il lavoro utile per ogni thread attivo.

In termini comparativi, Arm dichiara prestazioni per rack superiori rispetto ai sistemi x86 di ultima generazione. Questo vantaggio deriva da una somma di fattori, tra cui  maggiore efficienza per core, migliore gestione del parallelismo e una più efficace distribuzione delle risorse di sistema. Il risultato, secondo Arm, è un incremento significativo della capacità elaborativa complessiva a parità di vincoli energetici e termici.

Arm chip

Un aspetto particolarmente rilevante è la collaborazione con Supermicro per lo sviluppo di configurazioni avanzate, tra cui un rack a raffreddamento liquido da 200 kW in grado di ospitare 336 CPU AGI, superando così i 45.000 core totali. Questo tipo di implementazione evidenzia chiaramente la direzione intrapresa dal settore, ormai orientato verso infrastrutture più dense e progettate per supportare carichi AI persistenti e in continua espansione.

L’ecosistema attorno al progetto appare già strutturato. Meta svolge il ruolo di partner principale, partecipando allo sviluppo con l’obiettivo di ottimizzare infrastrutture su scala gigawatt e integrarle con acceleratori proprietari come MTIA. Accanto a Meta, realtà come OpenAI, Cloudflare, SAP e SK Telecom stanno lavorando all’adozione della piattaforma in ambiti che spaziano dal cloud computing alle reti e ai servizi enterprise.

La disponibilità commerciale è già attiva tramite partner hardware come Lenovo e ASRockRack e, parallelamente, Arm sta contribuendo allo sviluppo di uno standard aperto attraverso l’Open Compute Project, introducendo un server di riferimento conforme alle specifiche DC-MHS. Una scelta che favorisce interoperabilità e accelerazione dell’adozione, due elementi cruciali in un mercato dove il time-to-deployment rappresenta un importante vantaggio competitivo.