Huawei ha svelato un nuovo strumento software pensato per migliorare l’efficienza dell’intelligenza artificiale, in particolare nella fase di inferenza dei grandi modelli. Si tratta di Unified Cache Manager (UCM), un algoritmo che ridistribuisce i dati tra diversi tipi di memoria in base ai requisiti di latenza, riuscendo così a ottimizzare le prestazioni anche senza fare affidamento esclusivo su chip HBM (High-Bandwidth Memory), oggi fondamentali per l’IA ma sempre più difficili da reperire per le aziende cinesi a causa delle restrizioni statunitensi.

UCM nasce dall’esigenza di gestire al meglio risorse di memoria eterogenee. I moderni sistemi di intelligenza artificiale, infatti, utilizzano diversi livelli di memoria: HBM (velocissima ma costosa), DRAM (più comune ma meno performante) e lo storage SSD, che garantisce capacità elevate ma con latenze maggiori. L’algoritmo sviluppato da Huawei assegna i dati a ciascun livello in modo intelligente, tenendo conto delle specifiche esigenze di tempo di accesso.

Secondo quanto dichiarato da Zhou Yuefeng, vicepresidente e responsabile della divisione data storage di Huawei, i test interni hanno mostrato risultati sorprendenti, con l’inferenza dei modelli di intelligenza artificiale che ha registrato una riduzione della latenza fino al 90% e un incremento della capacità di elaborazione fino a 22 volte. Si tratta di numeri che, se confermati su larga scala, potrebbero rappresentare un cambiamento significativo nel modo in cui le aziende cinesi affrontano la sfida delle limitazioni hardware.

Un passo strategico per la Cina

Il lancio di UCM non è un semplice annuncio tecnico, ma si inserisce in un contesto geopolitico più ampio. Da oltre un anno, gli Stati Uniti hanno imposto restrizioni severe sull’export di chip avanzati e di memorie HBM verso la Cina, con l’obiettivo di frenare lo sviluppo del settore dei semiconduttori del Paese. Poiché il mercato HBM è dominato da pochi player internazionali (in particolare SK Hynix, Samsung Electronics e Micron Technology), le aziende cinesi si trovano a dover fronteggiare una dipendenza tecnologica che rischia di rallentare la loro corsa all’IA.

Con UCM, Huawei dimostra come sia possibile compensare la mancanza di accesso all’hardware più avanzato con soluzioni software. Questa strategia non è comunque isolata se si pensa ad esempio al caso di DeepSeek, la start-up cinese che ha conquistato l’attenzione internazionale mostrando di poter addestrare modelli di grande scala pur disponendo di risorse limitate.

Huawei ha inoltre annunciato che UCM sarà open source a partire da settembre, inizialmente all’interno della propria community online di sviluppatori e successivamente disponibile all’intera industria. Questa scelta non solo potrebbe accelerare l’adozione del sistema, ma anche consolidare l’ecosistema cinese di software dedicati all’IA, riducendo ulteriormente la dipendenza da tecnologie straniere.

ai summit

Crediti: Shutterstock

Il mercato HBM e la rincorsa cinese

Il settore delle memorie HBM è oggi uno dei più strategici a livello globale. Secondo le stime di Yole Group, il mercato mondiale potrebbe raggiungere 34 miliardi di dollari nel 2025 e quasi triplicare entro il 2030, arrivando a 98 miliardi, trainato dalla domanda crescente di intelligenza artificiale e supercalcolo.

La Cina, tuttavia, è in ritardo. Aziende come Yangtze Memory Technologies, Changxin Memory Technologies e Tongfu Microelectronics stanno lavorando a soluzioni domestiche, ma la maggior parte si trova ancora in fasi di sperimentazione o produzione limitata di chip HBM2, mentre i leader stranieri sono già alla generazione HBM4. Inoltre, le restrizioni americane sull’export di macchinari per la produzione di semiconduttori rendono ancora più complessa la rincorsa.

Parallelamente, Huawei continua a rafforzare il proprio ecosistema di calcolo per l’IA. Con la serie di processori Ascend e il supercalcolatore CloudMatrix 384, l’azienda ha mostrato l’ambizione di competere con le soluzioni di Nvidia, attualmente leader del settore. Solo poche settimane fa, Huawei ha anche annunciato l’apertura della sua Compute Architecture for Neural Networks (CANN), toolkit per lo sviluppo di applicazioni IA su Ascend, in diretta concorrenza con l’ecosistema CUDA di Nvidia.

Nel frattempo, gli attriti commerciali tra Washington e Pechino hanno coinvolto lo stesso colosso americano. Il chip Nvidia H20, versione ridimensionata dei modelli avanzati per il mercato cinese, è finito al centro delle incertezze politiche, spingendo il governo cinese a consigliare alle aziende locali di orientarsi verso alternative domestiche.

E l’occidente?

Al di là del contesto cinese, l’approccio di Huawei con Unified Cache Manager potrebbe suscitare interesse anche in Occidente. La scarsità e l’elevato costo dei chip HBM, infatti, sono problematiche globali che toccano anche aziende statunitensi ed europee impegnate nello sviluppo di modelli di intelligenza artificiale su larga scala.

Un algoritmo in grado di sfruttare in modo efficiente diversi livelli di memoria, riducendo la dipendenza dall’HBM e massimizzando le risorse già disponibili, ha un valore potenzialmente universale. Tuttavia, il fattore geopolitico rappresenta un ostacolo concreto, dal momento che le restrizioni commerciali e le diffidenze verso Huawei rendono improbabile un’adozione diretta del software da parte di grandi gruppi occidentali.

Più realistico è invece uno scenario in cui la strategia inaugurata da UCM possa ispirare sviluppi simili in altri ecosistemi, in particolare in quelli dominati da Nvidia e dalle principali piattaforme cloud statunitensi.