Gigantino (Google): le aziende devono saltare sul treno dell’AI, anche se è già in corsa

Indice dell'articolo
Il 60% dei progetti AI crea già valore misurabile secondo il Politecnico di Milano, ma la distanza tra prototipo e produzione rimane un problema per le imprese. Da un lato, un alto tasso di progetti pilota che non soddisfano le aspettative e non arrivano in produzione. Dall’altro, il paradosso che accompagna ogni conversazione sull’AI enterprise: mentre i team aziendali validano un prototipo, il mercato ha già spostato l’asticella con nuovi modelli e nuovi paradigmi.
Prima i chatbot, poi la RAG, poi gli agenti autonomi, ora gli sciami di agenti. Il ciclo di vita di un pilota rischia di essere più lungo del ciclo di obsolescenza della tecnologia su cui è costruito.
Raffaele Gigantino, Country Manager di Google Cloud Italia non nega il problema, ma lo inquadra diversamente: “Le grandi organizzazioni hanno la necessità di stabilizzare il software, non possono fare un rilascio a settimana. I modelli precedenti però sono ancora estremamente performanti. Non è necessario lavorare sempre con l’ultimo rilasciato. Gemini Enterprise va proprio in questa direzione.” In pratica: definire i success criteria del progetto, andare in produzione con ciò che si è validato, e non rincorrere ogni novità come se il precedente fosse già inutile.
Quale suggerimento quindi per i CIO che vedono trasformarsi tutto attorno a sé?: “Bisogna agire adesso. In questo momento credo che l’atteggiamento ‘wait and see’ possa creare più problemi che opportunità”.
Il costo dei token scende, ma il budget AI si espande
Uno dei temi più concreti per i CIO è l’economia del consumo dell’AI. Da un lato, c’è un costante calo del costo per token e anche un miglioramento delle prestazioni dei modelli, e Gemini 3.5 Flash ne è l’esempio più recente. Secondo i dati presentati da Sundar Pichai a Google I/O, le aziende più grandi elaborano fino a un trilione di token al giorno. Ebbene, spostando l‘80% di quei carichi dai modelli di frontiera a Gemini 3.5 Flash, risparmierebbero oltre un miliardo di dollari all’anno, reinvestibili nel business.
Gigantino sottolinea che la decrescita del costo per token è un dato strutturale, non congiunturale. Il modello Flash compete con i migliori modelli di mercato su benchmark di codifica ed è circa quattro volte più veloce in termini di token generati al secondo.
Osserviamo che c’è però un effetto collaterale che chi gestisce i budget IT conosce bene: abbassare il costo unitario non riduce necessariamente la spesa, se nel frattempo si moltiplicano i casi d’uso. Lanciare dodici agenti in contemporanea consuma molti più token di una singola sessione di chat…
Dal prototipo alla produzione: cosa separa chi ce la fa
Gli analisti stimano che una quota significativa di progetti AI non superi la fase sperimentale. Il Politecnico di Milano indica però che sei progetti su dieci creano comunque valore, anche se non quello atteso. Il 40% restante rappresenta comunque un tasso di insuccesso rilevante per tecnologie in cui le aspettative sono altissime.
Per Gigantino, il problema centrale è inquadrare correttamente fin dall’inizio qual è il problema da risolvere e quali sono i criteri di successo in base a kpi misurabili. “Affinché un pilota diventi un progetto di successo in produzione ci vuole un’organizzazione aziendale. Bisogna seguire il ciclo di sviluppo di queste nuove applicazioni agentiche. Se non c’è un allineamento executive e una struttura organizzativa che consente di mettere in esercizio nei tempi giusti e con i costi giusti, è chiaro che le sperimentazioni possono fallire”, commenta.
Sul fronte dei casi di successo in Italia, il settore retail e moda è quello che Gigantino cita con maggiore enfasi, contagiato dall’entusiasmo di Renzo Rosso, fondatore di OTB Group (Diesel, Jil Sanders e altri marchi) che ricevendo sul palco il premio AI Creativity del Google Cloud AI Groundbreaker Awards per il progetto “Virtual try-on”, ha dichiarato con la consueta schiettezza: “L’AI oggi è una figata. Erano cinque anni che volevo fare qualcosa del genere e non ci riuscivo”.
Stellantis ha invece usato il modello Veo di Google per realizzare una campagna pubblicitaria declinata dallo spot televisivo ai contenuti per i social, in più lingue simultaneamente, comprimendo sensibilmente i tempi di produzione.
Freedom to choose: l’anti lock-in come proposta commerciale
Una delle tensioni tipiche nelle scelte di piattaforma AI è il rischio di dipendenza da un singolo fornitore. Google Cloud prova a gestirla con quello che Gigantino chiama “freedom to choose, freedom to run, freedom to govern”: sul Model Garden di Vertex AI sono oggi disponibili 250 modelli di terze parti, e il marketplace degli agenti è aperto a soluzioni esterne. “Siamo consapevoli che ci possono essere modelli di terze parti preferiti dai clienti, o perché performano meglio o perché hanno costi diversi, e vogliamo offrire la libertà di scegliere”. E non può che essere altrimenti: tra i grandi dell’AI Google si trova nella posizione unica di poter offrire tutto lo stack, dal silicio delle TPU alle piattaforme agentiche. Limitare l’offerta ai soli clienti che scelgono Gemini, limiterebbe enormemente il successo di tutti gli altri elementi.
Google sta inoltre contribuendo alla definizione degli standard di interoperabilità del settore: il protocollo Agent-to-Agent (A2A) per la comunicazione tra agenti autonomi e il Model Context Protocol (MCP) per l’integrazione con sistemi esterni sono due degli standard su cui l’azienda sta investendo in concerto con l’industria.
