La recente IPO di Cerebras Systems a Wall Street è la più grande quotazione tech del 2026, diventando il simbolo di una trasformazione profonda nel mercato dei semiconduttori per l’AI. La società californiana, spesso definita “l’anti-NVIDIA”, ha raccolto oltre 5,5 miliardi di dollari, raggiungendo una valutazione superiore ai 56 miliardi e chiudendo il debutto sul Nasdaq con un rialzo vicino al 70%.

Dietro l’euforia degli investitori non c’è però solo la fame di titoli legati all’intelligenza artificiale. Il successo di Cerebras riflette infatti anche la crescente convinzione che il monopolio tecnologico costruito da NVIDIA negli ultimi anni possa iniziare a incrinarsi. Non necessariamente perché NVIDIA stia rallentando, ma perché il mercato AI sta entrando in una nuova fase nella quale servono architetture differenti rispetto a quelle che hanno dominato l’era dell’addestramento dei grandi modelli linguistici.

Per capire perché Cerebras stia attirando così tanta attenzione, bisogna partire dal cuore della sua tecnologia. L’azienda, fondata nel 2015, ha scelto di non seguire il percorso delle GPU tradizionali. Invece di progettare chip relativamente piccoli da collegare in enormi cluster, Cerebras ha sviluppato il concetto di “Wafer Scale Engine”, ovvero un processore gigantesco costruito utilizzando praticamente un intero wafer di silicio.

Il risultato è che un singolo chip Cerebras contiene centinaia di migliaia di core AI e una quantità enorme di memoria integrata, riducendo drasticamente i colli di bottiglia legati alla comunicazione tra GPU multiple. In pratica, dove NVIDIA ottiene potenza aggregando migliaia di processori H100 o Blackwell interconnessi, Cerebras prova a concentrare tutto in un’unica gigantesca unità computazionale.

È una filosofia radicalmente diversa e oggi questa differenza conta moltissimo. Addestrare modelli come GPT, Gemini o Claude richiede potenza computazionale estrema, ma soprattutto velocità nel trasferimento dei dati. NVIDIA ha costruito un impero proprio grazie alla sua capacità di offrire sia GPU potentissime, sia un ecosistema software praticamente standardizzato attraverso CUDA. Questo vantaggio resta enorme e difficilmente replicabile nel breve periodo.

Cerebras nvidia

Tuttavia, il mercato AI del 2026 non è più quello del 2023. La fase iniziale della corsa all’intelligenza artificiale era dominata soprattutto dal training dei modelli, mentre oggi il vero nodo economico è l’inferenza, ovvero l’esecuzione concreta dei modelli AI quando milioni di utenti interrogano chatbot, agenti intelligenti o sistemi generativi.

Ed è proprio qui che Cerebras sta cercando di primeggiare. Secondo la società, il suo hardware può offrire latenze inferiori e throughput molto più elevati rispetto alle GPU tradizionali in diversi scenari di inferenza AI. L’obiettivo principale sta nel ridurre la dipendenza da giganteschi cluster GPU che consumano enormi quantità di energia e richiedono infrastrutture estremamente complesse.

Il tema energetico, infatti, sta diventando centrale. I datacenter AI stanno iniziando a porre problemi di sostenibilità economica ed elettrica, con ogni nuova generazione di modelli che richiede quantità crescenti di energia, raffreddamento e networking. Ecco perché l’idea di concentrare enormi capacità computazionali in sistemi più compatti e meno frammentati sta diventando estremamente attraente per hyperscaler e cloud provider.

Non sorprende quindi che Cerebras abbia già stretto accordi strategici con realtà come OpenAI, Amazon Web Services e diversi operatori internazionali del settore AI. La IPO ha quindi assunto anche un valore geopolitico e strategico. Gli investitori vedono in Cerebras uno dei pochi attori occidentali potenzialmente in grado di contrastare l’iper-dominio di NVIDIA nell’hardware AI. In parallelo, governi e grandi gruppi industriali stanno cercando di evitare una concentrazione eccessiva della filiera AI attorno a un singolo fornitore.

Questo non significa che NVIDIA sia davvero in pericolo nel breve termine. L’azienda guidata da Jensen Huang mantiene infatti vantaggi enormi in termini di ecosistema software, supply chain, supporto sviluppatori e presenza nei datacenter globali. CUDA resta di fatto lo standard industriale dell’AI accelerata e migrare verso nuove architetture non è semplice.

Inoltre, esistono ancora dubbi concreti sul modello di business di Cerebras. Alcuni analisti hanno infatti sottolineato la forte dipendenza da pochi grandi clienti e il fatto che parte della redditività recente derivi da operazioni contabili e partnership strategiche più che da una maturità commerciale pienamente consolidata. Anche sul piano tecnico la sfida è aperta. Un recente studio accademico che ha confrontato diverse architetture di accelerazione AI ha evidenziato come soluzioni alternative alle GPU NVIDIA possano eccellere in determinati workload, ma mostrino ancora limiti in termini di efficienza energetica a basso utilizzo e maturità software.

Dopo questa IPO appare comunque evidente come gli investitori stiano scommettendo forte su un mercato AI ormai troppo grande e importante per essere dominato da un solo attore.