DeepSeek V3.1: l’LLM cinese da 685 miliardi di parametri che sfida la leadership USA

Il settore dell’intelligenza artificiale sta vivendo una fase di accelerazione senza precedenti e uno dei protagonisti di questa corsa è la startup cinese DeepSeek. L’azienda ha recentemente annunciato il rilascio di DeepSeek V3.1, il suo LLM più avanzato fino ad oggi con ben 685 miliardi di parametri. Si tratta di una dimensione che lo pone direttamente in competizione con i giganti americani come OpenAI e Anthropic, consolidando la Cina come attore centrale nello scenario globale dell’IA.
Anche se il nuovo modello è stato reso disponibile su Hugging Face senza particolari annunci mediatici, i primi benchmark lo descrivono come in grado di offrire prestazioni comparabili con quelle dei modelli proprietari occidentali. Il rilascio di DeepSeek V3.1 si inserisce proprio in un contesto di competizione serrata.
OpenAI ha di recente reso disponibili i suoi primi modelli “open-weight” dai tempi di GPT-2, anche come risposta alla pressione crescente proveniente dai laboratori cinesi. Sam Altman, CEO di OpenAI, ha riconosciuto che l’avanzata delle startup cinesi rappresenta un elemento che ha influenzato questa decisione, sottolineando al tempo stesso come le restrizioni alle esportazioni in Cina non possano garantire da sole un vantaggio duraturo agli Stati Uniti.
Gli analisti vedono in DeepSeek V3.1 un passo decisivo verso la “commoditizzazione” delle capacità IA. Secondo Oishi Mazumder, senior analyst di Everest Group, il nuovo modello cinese erode il vantaggio competitivo dei sistemi chiusi, costringendo player come OpenAI, Anthropic e Google a differenziarsi non più sulla sola potenza dei modelli, ma anche su aspetti come governance, affidabilità e servizi dedicati alle imprese.
Uno degli elementi più interessanti di DeepSeek V3.1 è la sua natura open source, che rimuove molte delle barriere tradizionalmente associate ai modelli su larga scala. Per le aziende e gli sviluppatori, avere accesso libero a un modello di tali dimensioni significa poter sperimentare e innovare senza dover affrontare i vincoli tipici dei sistemi proprietari e a pagamento.Tra le altre caratteristiche spiccano l’input di contesto fino a 128K token, miglioramenti nel ragionamento matematico e programmazione frontend, architettura Mixture-of-Experts e supporto per oltre 100 lingue.
La disponibilità di un LLM dalle prestazioni paragonabili a quelle dei big occidentali ma con licenze permissive può diventare molto interessante per CIO e team IT che cercano di sviluppare internamente soluzioni IA, ridurre i costi e avere un controllo più diretto sul deployment.
Tuttavia, la scala del nuovo modello pone anche nuove sfide. Rispetto alle versioni precedenti, l’implementazione di DeepSeek V3.1 richiede infatti risorse computazionali imponenti, sollevando questioni legate a infrastruttura, compliance e vincoli geopolitici. Inoltre, le difficoltà riscontrate da DeepSeek nel completare l’addestramento con i chip Huawei (poi sostituiti con hardware Nvidia) evidenziano quanto il contesto delle restrizioni tecnologiche internazionali continui a pesare.
Nel breve termine, gli analisti ritengono comunque improbabile che DeepSeek V3.1 possa avere un impatto immediato sul mercato statunitense. Le aziende americane restano infatti più inclini ad affidarsi a fornitori domestici, che garantiscono ecosistemi profondamente integrati, supporto di livello enterprise e conformità normativa.
Perché gli LLM come V3.1 abbiano successo negli Stati Uniti dovranno cambiare due condizioni: un alleggerimento delle tensioni geopolitiche e una dimostrazione concreta di superiorità rispetto ad altri modelli open source occidentali, come quelli di Meta e Mistral.
Al di fuori del contesto americano, però, la situazione è diversa. La licenza open di DeepSeek potrebbe attrarre aziende in Europa, Asia e mercati emergenti, desiderose di accelerare lo sviluppo interno senza vincolarsi a costosi abbonamenti o a un’infrastruttura cloud proprietaria. Per queste realtà, il compromesso tra maggiore libertà e complessità di gestione potrebbe risultare vantaggioso.
Ciononostante, restano dei punti critici e il primo è che DeepSeek faticherà a raggiungere i livelli di sicurezza, affidabilità e compliance offerti da modelli come Claude Sonnet 4 di Anthropic, già pienamente orientati al settore enterprise.
(Immagine in apertura: Shutterstock)