Lenovo Hybrid AI Platform offre inferenza a costi più bassi, anche senza GPU

Lenovo sta ridefinendo la propria strategia sull’intelligenza artificiale enterprise puntando con decisione sull’inferenza distribuita. Con l’espansione della piattaforma Hybrid AI Advantage, il gruppo cinese introduce una nuova generazione di soluzioni progettate per eseguire modelli AI e agenti autonomi direttamente dove vengono creati i dati, senza dipendere esclusivamente dal cloud pubblico.
Il cambio di prospettiva è significativo se pensiamo che fino a poco tempo fa gran parte dell’industria AI concentrava investimenti e attenzione soprattutto sull’addestramento dei modelli. Oggi invece il vero problema economico riguarda l’inferenza, cioè l’esecuzione continua delle richieste AI all’interno di aziende, servizi digitali e infrastrutture operative. È qui che si accumulano costi energetici, latenza, problemi di governance e complessità infrastrutturale.
Lenovo sostiene che le imprese stiano ormai superando la fase sperimentale dell’AI generativa. Secondo i dati citati dal gruppo, il 94% delle aziende sarebbe pronto ad aumentare gli investimenti AI nel prossimo anno, ma il focus si starebbe spostando dai semplici proof-of-concept verso risultati economici concreti e misurabili. In pratica, i CIO non chiedono più demo spettacolari, ma vogliono capire quanto costa realmente mantenere l’AI su larga scala.
Ed è proprio sul tema dei costi che Lenovo costruisce l’intera narrativa della nuova Hybrid AI Factory. L’idea è eseguire l’intelligenza artificiale vicino ai dati e ai processi aziendali per permettere di migliorare prestazioni, sicurezza e controllo operativo, riducendo contemporaneamente la dipendenza da API cloud esterne.
Il concetto di “economia dei token” diventa quindi centrale. Ogni interazione con un modello linguistico ha un costo computazionale preciso e, quando i volumi aumentano, la spesa può crescere rapidamente oltre le aspettative iniziali. Lenovo cita ricerche di settore secondo cui il 92% delle organizzazioni impegnate nello sviluppo di AI agentica avrebbe registrato costi finali superiori alle previsioni.
Per affrontare questo scenario, l’azienda ha presentato nuove piattaforme AI ibride sviluppate insieme a partner strategici come NVIDIA, Intel, Red Hat e Canonical. Una delle novità più interessanti è la Lenovo Hybrid AI Platform with Red Hat in configurazione CPU-only, basata sui nuovi processori Intel Xeon 6 con accelerazione AI integrata.
La scelta di enfatizzare soluzioni CPU-centriche è tutt’altro che casuale e, a tal proposito, Lenovo sostiene che molti carichi enterprise legati all’inferenza possano essere gestiti in modo economicamente più sostenibile sfruttando CPU moderne ottimizzate per AI. Secondo Lenovo, questa piattaforma sarebbe in grado di elaborare circa il doppio delle richieste AI simultanee rispetto alle generazioni precedenti, migliorando throughput, latenza e tempo di risposta iniziale. È un approccio pensato soprattutto per casi d’uso enterprise concreti come Retrieval-Augmented Generation, supporto clienti, assistenza HR e automazione documentale.
L’obiettivo non è competere frontalmente con i giganteschi cluster GPU utilizzati per addestrare foundation model, ma creare un’infrastruttura scalabile, economicamente prevedibile e più semplice da gestire per le aziende che devono distribuire AI quotidianamente.
Accanto alla piattaforma Red Hat, Lenovo propone anche una configurazione costruita attorno all’ecosistema Canonical Ubuntu e Kubernetes. Qui il focus è sulla rapidità di deployment e sulla sovranità dei dati, due temi diventati cruciali soprattutto in Europa dove normative e compliance stanno influenzando sempre di più le strategie AI delle imprese.
La vera ambizione di Lenovo emerge però nella componente agentica. L’azienda vuole trasformare l’AI da semplice strumento conversazionale a sistema autonomo capace di eseguire task complessi multi-step con supervisione umana limitata. È il motivo per cui la società parla apertamente di implementazione “one-click” di agenti AI persistenti. In pratica, Lenovo immagina ambienti enterprise dove agenti software intelligenti possano recuperare informazioni da sistemi aziendali scollegati, analizzare dati, automatizzare operazioni IT e supportare processi decisionali senza richiedere interazioni continue da parte degli utenti.
Uno degli esempi più concreti è il cosiddetto “Knowledge Super Agent”, progettato per aggregare e sintetizzare dati provenienti da fonti multiple attraverso un’unica interfaccia AI. Secondo Lenovo, strumenti di questo tipo potrebbero eliminare migliaia di ore di lavoro spese nella ricerca manuale di informazioni distribuite tra piattaforme aziendali differenti. Il gruppo sta anche lavorando sull’AIOps sfruttando framework NVIDIA NemoClaw per automatizzare rilevamento anomalie, troubleshooting e gestione preventiva dei problemi infrastrutturali.
Interessante anche la strategia legata alle workstation ThinkStation PGX, che Lenovo propone come ambienti personali di AI Factory destinati agli sviluppatori. L’idea è offrire un ecosistema “chiavi in mano” per creare, testare ed eseguire agenti AI localmente prima di scalarli verso implementazioni enterprise più estese.
Tra le novità presentate compare anche Lenovo XClarity One, soluzione destinata a centralizzare visibilità, automazione e controllo delle infrastrutture ibride, oltre ai cluster Nutanix Compute only Cluster su server ThinkSystem, progettati per ridurre complessità operativa mantenendo ambienti virtualizzati enterprise.
La direzione intrapresa da Lenovo fotografa perfettamente l’evoluzione del mercato AI enterprise nel 2026. Dopo la fase iniziale dominata dall’entusiasmo per chatbot e modelli generativi, il settore sta entrando in un momento molto più pragmatico che ha come priorità assolute contenimento dei costi, sostenibilità energetica, governance dei dati e automazione reale dei processi aziendali.
(Immagine in apertura: Shutterstock)


