Si è aperto oggi Google Cloud Next, evento annuale dedicato alla divisione Cloud di Google, che include servizi di infrastruttura, produttività (con i SaaS di Google Workspace), ricerca e sviluppo software e security, settore nel quale ricadono i prodotti e servizi derivanti dall’acquisizione di Mandiant.

L’evento è tradizionalmente ricco di annunci e novità, ma quest’anno praticamente ogni settore, ambito e servizio è stato interessato da miglioramenti o nuovi prodotti che seguono un unico filo conduttore: l’intelligenza artificiale, e in particolare la IA generativa.

È incredibile pensare che solo la scorsa edizione avveniva infatti in un mondo in cui non era ancora arrivato ChatGPT di OpenAI (almeno per il grande pubblico), e con esso la pletora di startup, modelli concorrenti (tra qui ovviamente quelli di Google) e adozione della tecnologia da parte di praticamente tutte le aziende tech.

Google, che pure ha inventato la tecnologia dei transformer che sta alla base dei modelli linguistici e di IA generativa più moderni (la T di GPT sta appunto per Transformer), all’inizio di quest’anno è sembrata arrancare alla rincorsa di OpenAI, del suo nuovo partner Microsoft (che ha incluso la tecnologia GPT in Azure, in Office e nel motore di ricerca Bing) e di nuove startup.

Il ritardo è stato imputato in parte a una maggiore cautela di Google nell’adottare una tecnologia nuova e non priva di rischi, e in parte al fatto che in certi ambiti, come la ricerca Web, Google partiva da una posizione di assoluto dominio e interdipendenza con l’ecosistema della pubblicità online. Aveva insomma da perdere molto di più rispetto a una startup, ma anche rispetto a Microsoft, che con Bing occupa una posizione marginale nel mercato della ricerca.

Ebbene, a scorrere la lunga lista di annunci di Google Cloud Next, pare che ogni indugio sia stato accantonato: Google si sta posizionando come azienda di riferimento per chi abbia necessità di sviluppare, erogare, distribuire o utilizzare modelli di intelligenza artificiale generativa e non, lungo tutta la catena.

Quel che segue è solo una sintesi dei principali annunci fatti nei quattro ambiti, e che avremo modo di approfondire nei prossimi giorni e settimane.

La infrastruttura Google Cloud per la IA

Google ha presentato la versione 5e dei suoi TPU, Tensor Processing Unit, processori progettati per accelerare i calcoli necessari per le applicazioni di intelligenza artificiale. Dalla Google Cloud Platform sarà possibile creare infrastrutture scalabili fino a migliaia di Cloud TPUv5e per compiti di training o di erogazione di modelli IA (calcolo inferenziale). Google dichiara che rispetto ai precedenti v4, i TPUv5 offrono prestazioni doppie a parità di spesa nella fase di addestramento, e di 2,5 volte superiori nel calcolo inferenziale.

Per le applicazioni di IA più esigenti, dal prossimo mese saranno disponibili le macchine virtuali sul supercomputer A3, costruito attorno alle GPU Nvidia H100 e con reti ad alte prestazioni che secondo Google permetteranno di addestrare o utilizzare large language model con prestazioni triple rispetto al precedente A2 (diversamente dai TPU, non si fa però riferimento all’efficienza per dollaro). Sempre per le applicazioni più esigenti, il Google Kubernetes Engine permette ora di scalare le applicazioni orizzontalmente su più cluster.

Novità sono state introdotte anche attorno alla Google Distributed Cloud, che permette di erogare anche i nuovi servizi IA in ambienti Edge o all’interno di data center dei clienti completamente isolati, mentre la Google Cross Cloud Network permetterà di collegare più cloud in un network ad alte prestazioni adatto ad applicazioni IA e real time.

Vertex AI e gli strumenti per sviluppatori

La piattaforma per lo sviluppo, addestramento ed erogazione di modelli e applicazioni AI si arricchisce con nuovi modelli e funzionalità. Tra i modelli fondamentali, oltre a quelli “della casa” (tra cui il LLM generalista PaLM 2, le sue declinazioni medicali Med-PaLM 2 e Sec-PaLM 2 per la cyberecurity, Codey per lo sviluppo di codice,  e Imagen per l’elaborazione di immagini), nel Model Garden di Vertex AI sboccieranno anche modelli di terze parti e open source come Claude 2 di Anthropic, Falcon LLM del Technology Innovative Institute e soprattutto Llama 2 di Meta. Google dichiara di essere l’unica piattaforma ad offrire oltre al modello a che la regolazione dell’adapter che gli strumenti per il RLHF (apprendimento di rinforzo con intervento umano).

Assisteremo probabilmente sempre di più a una diffusione del modelli IA attraverso cloud e piattaforme di aziende solo apparentemente concorrenti: il verso business della IA si sta plasmando attorno alle enormi infrastrutture necessarie al training su grandi moli di dati, e non sulla proprietà intellettuale dei modelli, che stanno diventando una commodity con la diffusione dei modelli open source.

Sarà però un elemento differenziante la possibilità di affinare l’addestramento dei modelli utilizzando dati e direttive specifiche del cliente. Per esempio, Imagen potrà essere affinato per creare immagini allineate a uno style guide dell’immagine aziendali, mentre attraverso le estensioni di Vertex AI sarà possibile far interagire i modelli IA con i sistemi aziendali come ERP o CRM. Il tutto però garantendo una tutela dei dati e delle informazioni aziendali in linea con le direttive della governance.

Duet AI, l’assistente per Google Workspace e Google Cloud

Il servizio di assistente virtuale di Google Workspace presentato a giugno in anteprima per alcune aziende sarà ora disponibile in prova gratuita per tutti i clienti di Worskpace Enterprise, arricchito di nuove funzionalità per permettere di realizzare sintesi delle riunioni tenutesi in Google Meet o riassumere i contenuti di una chat, permettendo quindi di recuperare rapidamente le informazioni su discussioni o contenuti prodotti durante la nostra assenza. Google Chat sta crescendo in funzionalità e numero massimo di utenti, cercando probabilmente di andare a posizionarsi nel territorio ora occupato da Slack e Microsoft Teams.

All’interno di Google Workspace, Duet AI potrà eseguire compiti come la creazione di email, documenti, report o generazione di fogli di calcolo attingendo alle informazioni presenti in Gmail o Google Drive aziendali, sempre garantendo che le informazioni non saranno usate per addestrare il modello generale (confitando quindi alcuni timori che si erano sollevati questa estate in seguito ad alcune modifiche fatte alle condizioni di servizio di Google).

Tra le altre funzioni AI che saranno introdotte in Meet c’è il rilevamento dei volti per ottimizzare la resa nelle riunioni, la generazione di sottotitoli tradotti in tempo reale in 18 lingue e una modalità di appunti automatici.

Al termine della prova gratuita, il costo di Duet AI per Workspace sarà di 30 dollari al mese per utente, un prezzo elevato ma in linea con quello di Microsoft 365 Copilot. Nel corso dei prossimi mesi l’offerta Duet AI sarà estesa dai piani per Enterprise includere anche  quelli per le piccole imprese e i consumatori.

Duet AI per gli altri prodotti Google

Oltre che in Google Workspace, Duet AI sarà utilizzabile anche per ottenere assistenza nel generare impostazioni, infrastrutture e codice per Google Cloud.  o per la creazione e l’addestramento di modelli in Vertex AI, abbassando la barriera delle competenze necessarie per la creazione e l’erogazione di modelli IA o altre applicazioni cloud.

Sarà per esempio possibile usare Duet AI per scrivere query o codice Python da usare in BigQuery, interrogare dati per ottenere risposte e visualizzazioni in Looker Studio, oppure ottenere assistenza per effettuare la migrazione di un database da Oracle a PostgreSQL attraverso il Database Migration Service.

In ambito cybersecurity, Duet AI sarà integrato alla Threat Intelligence di Mandiant per velocizzare il rilevamento delle minacce, nel Chronicle Security Operations e nel Security Command Center, per avere un’interfaccia conversazionale per fare una valutazione dei rischi e ottenere raccomandazioni per migliorare la propria postura di sicurezza.

Queste funzionalità sono al momento solo in anteprima, con la disponibilità generale attesa entro la fine dell’anno.

Altri annunci e le sessioni in corso

È possibile seguire le sessioni in diretta o avere una panoramica degli annunci sul sito di Google Cloud Next 2023 a partire dalle 17.30 di oggi.