Upscale AI raccoglie 190 milioni per il networking AI basato su standard aperti

La startup californiana Upscale AI ha annunciato un nuovo round di finanziamento da 190 milioni di dollari, cifra che porta la raccolta complessiva ben oltre i 390 milioni dopo il Series A iniziale chiuso all’inizio dell’anno. L’operazione spinge la valutazione della società a circa 2 miliardi di dollari e conferma quanto il mercato consideri strategico il tema dell’interconnessione tra acceleratori e cluster GPU.

L’elenco degli investitori racconta molto dell’importanza attribuita a questo settore. Accanto a Premji Invest figurano nomi come Nvidia, Salesforce Ventures, Temasek e altri fondi già presenti nel capitale della startup. Un segnale chiaro di come nel mondo AI non basti più aumentare la potenza computazionale dei chip, perché il vero collo di bottiglia si sta spostando sempre più sulla capacità di far comunicare rapidamente migliaia di GPU all’interno dei data center.

Nei cluster AI moderni, i server devono infatti scambiarsi enormi quantità di dati in tempo reale durante le fasi di training e inferenza. Anche microvariazioni nella latenza possono rallentare intere catene di elaborazione e quando un singolo passaggio computazionale subisce un ritardo, tutte le operazioni successive vengono inevitabilmente sincronizzate verso il basso, con effetti pesanti sull’efficienza generale del sistema.

Upscale AI sta cercando di intervenire esattamente su questo problema attraverso una nuova generazione di switch progettati specificamente per carichi AI. L’azienda distingue il proprio portafoglio in due categorie: switch scale-up e switch scale-out. I primi gestiscono la comunicazione interna tra GPU e server presenti nello stesso rack, mentre i secondi si occupano del traffico tra rack differenti all’interno del data center.

Al centro della proposta di Upscale AI c’è un chip proprietario chiamato SkyHammer, sviluppato per garantire una latenza prevedibile e stabile. Significa che i tempi di trasferimento dei dati possono essere anticipati con maggiore precisione, evitando quei picchi improvvisi che rischiano di compromettere la sincronizzazione delle elaborazioni AI.

Un approccio molto diverso rispetto alle tradizionali reti Ethernet enterprise, nate per gestire carichi più variabili e meno sensibili a ritardi di millisecondi. Nei sistemi AI hyperscale, invece, la prevedibilità della comunicazione tra GPU è diventata un requisito quasi imprescindibile.

SkyHammer supporta inoltre diversi protocolli open source orientati ai workload AI. Tra questi spicca UALink, tecnologia che consente alle GPU di accedere alla memoria delle altre schede come se fosse RAM locale. È un elemento particolarmente importante per i modelli distribuiti di grandi dimensioni, dove la condivisione rapida dei dati può incidere drasticamente sui tempi di addestramento.

La compatibilità con ESUN, evoluzione di Ethernet ottimizzata per ambienti AI, evidenzia un altro trend molto forte dell’industria come l’abbandono progressivo delle architetture proprietarie a favore di standard aperti ma altamente specializzati. Le aziende cloud cercano infatti infrastrutture più flessibili, interoperabili e meno dipendenti da singoli vendor.

Accanto agli switch scale-up, Upscale AI sta lavorando anche sul segmento scale-out, probabilmente il più delicato nell’espansione dei cluster GPU su larga scala. In questo caso la startup utilizza i chip Nvidia Spectrum-X, piattaforma Ethernet sviluppata specificamente per le esigenze dell’intelligenza artificiale.

Upscale AI intende differenziarsi ulteriormente integrando il silicio Spectrum-X con SONiC, sistema operativo open source originariamente sviluppato da Microsoft per Azure. SONiC è già molto diffuso negli hyperscaler grazie alla sua flessibilità e alla possibilità di personalizzare profondamente la gestione di rete. Tuttavia richiede competenze elevate e configurazioni spesso complesse.

La startup sostiene di aver sviluppato una variante AI-optimized di SONiC capace di semplificare deployment, orchestrazione e gestione dei workload sincronizzati. Secondo il CEO Barun Kar, il networking rappresenta ormai uno dei principali punti critici dell’infrastruttura AI moderna e l’obiettivo è costruire un “AI fabric” ad alte prestazioni basato su standard aperti e progettato per cluster di grandi dimensioni.

Upscale AI afferma che i propri sistemi sono già in fase di valutazione presso hyperscaler e operatori neocloud, segmento in forte crescita grazie alla domanda di servizi AI dedicati. Il nuovo capitale servirà soprattutto ad accelerare la commercializzazione delle piattaforme, in un mercato che vede aumentare rapidamente la competizione tra specialisti del networking ad alte prestazioni.

Upscale AI raccoglie 190 milioni per il networking AI basato su standard aperti

Francesco Destri