L’evento annuale Google I/O è stato dominato dagli annunci sull’intelligenza artificiale, e in particolare dall’IA generativa, che è entrata o sta per entrare in varia forma in decine di prodotti e servizi Google, primi tra tutti Workspace, Gmail, Foto, Mappe e il gioiello della corona: la ricerca web.

L’attesa era alta, perché in gioco c’è molto. Google – che pure ha inventato la tecnologia dei Transformer su cui sono basati i modelli di IA generativa più recente – da inizio anno è sembrata arrancare un po’ nella rincorsa al binomio OpenAI/Microsoft, ma anche di altri prodotti o progetti come Adobe Firefly, Midjourney e compagnia.

Dal palco di Google I/O, il CEO Sundar Pichai e altri speaker hanno più volte sottolineato come Google intenda procedere con cautela, cercando di contrastare i possibili effetti negativi che le IA generative possono avere sulla società, dai possibili pregiudizi alla produzione di notizie o immagini false, agli errori fattuali che possono comportare danni per chi si affida alle informazioni generate. Sarà, ma la sensazione è che in alcuni campi si poteva fare di più, e anche che la diffusione di quanto già c’è potesse essere più ampia.

Vediamo quindi cosa bolle nella pentola di Google nei diversi settori.

PaLM 2: un nuovo modello linguistico

PaLM (Pathways Language Model) 2 è la nuova versione del modello linguistico che costituirà le fondamenta per tutti i servizi di IA generativa di Google.

Secondo l’azienda, PaLM 2 è stato addestrato più intensamente  su testi multilingua in più di 100 lingue. Questo dovrebbe migliorare le capacità di tradurre più fedelmente espressioni idiomatiche o in rima. Stranamente però, alcuni servizi come Bard saranno disponibili per ora soltanto in tre lingue: inglese, giapponese e coreano.

Nella parte di coding è stato migliorato il support anche ad alcuni linguaggi meno diffusi, come Fortran, Prolog e Verilog, e dovrebbero anche essere state migliorate le capacità di ragionamento logico e calcolo matematico grazie all’inclusione di più documenti scientifici nei dati di training.

A differenza di altri modelli, con PaLM 2 punta anche sulla creazione di versioni specializzate su determinati domini linguistici e di conoscenza. Accanto al modello dedicato alla medicina Med-PaLM, anch’esso aggiornato alla versione 2, Google ha annunciato anche Sec-PaLM, specializzato sui temi della cybersecurity.

Un’altra caratteristica interessante è che PaLM 2 è disponibile in quattro diverse “taglie”, Gecko, Otter, Bison e Unicorn, ciascuna con diverse richieste in termini di potenza di calcolo. La taglia più piccola, Gecko, è pensata per poter essere eseguita completamente in locale su un cellulare recente, senza bisogno di collegarsi a server esterni.

Un assistente intelligente in Google Workspace

Sebbene sarebbero state incredibili solo pochi mesi fa, le novità su Workspace sembrano replicare appena quanto Microsoft ha già mostrato con CoPilot (mostrato ma non rilasciato, se non a una platea molto ristretta di aziende partner) e in parte con Microsoft Designer, che invece è pubblicamente disponibile.

In ogni strumento per la composizione di testi, a partire da Gmail e Google Docs, sarà presente Duet AI, un assistente in grado di comporre documenti in base alle richieste fatte semplicemente scrivendo “Aiutami a scrivere…” (Help me write).

Una barra laterale presente in Google Docs, Fogli e Presentazioni permetterà similmente di fare richieste sul contenuto o la formattazione del documento, arrivando per esempio a creare un foglio di calcolo strutturato e con stili e funzioni semplicemente descrivendo il comportamento richiesto all’assistente.

Sarà inoltre possibile chiedere di inserire immagini correlate al testo scritto, o in base a una specifica descrizione. La generazione dei contenuti può anche avvenire recuperando informazioni dai dati contenuti nei documenti o messaggi presenti in Google Workspace, mentre la generazione di immagini sarà fornita da Firefly grazie a un accordo di collaborazione con Adobe.

Se fino a qui avete pensato più volte “ah, più o meno come CoPilot…”, non siete i soli.

La ricerca web intelligente che può funzionare, per tutti

Il segmento in cui Google sembra avere imbroccato l’implementazione giusta per la IA generativa è la ricerca web, e non poteva essere altrimenti considerando il ruolo cruciale che questa funzione ha per l’azienda e per l’intero ecosistema dell’informazione e del marketing sul web.

Gli esempi mostrati da Google sembrano dare maggiore importanza ai siti web consultati per generare la risposta, e dei principali appare un’anteprima con immagine nella parte destra della pagina. Per ogni affermazione viene indicato un sito usato come fonte. Sotto alla risposta compaiono gli ulteriori risultati in modalità tradizionale.

A confronto, nella modalità ricerca web Bing mostra i soliti risultati sulla sinistra, e un riquadro con la risposta testuale sulla destra. In modalità Chat, i siti usati come fonte sono indicati solamente come note a piè di pagina. Una posizione decisamente insoddisfacente per i publisher e gli autori dei contenuti.

Google sembra insomma aver prestato molta più attenzione all’intero ecosistema del web. Un ecosistema che fornisce la benzina che alimenta motori di ricerca e modelli di IA, i contenuti, ma che è anche principale cliente dei servizi pubblicitari. Ne abbiamo parlato più in dettaglio in questo articolo.

E c’è di più, ma quando arriva?

La IA generativa verrà anche usata per creare video e simulazioni di percorsi nelle Mappe di Google facendo un mix delle immagini Street View. Google Photo permetterà di rimuovere elementi indesiderati da un’immagine, modificare sfondo e cielo, ma anche ricostruire parti mancanti di una foto. Il tutto senza alcuna competenza di fotoritocco. E sul sito dell’evento è possibile trovare molti altri annunci interessanti.

È tutto molto bello, ma al momento disponibile ancora per pochi. Per accedere a Duet for Workspace è necessario che l’amministratore del dominio Workspace si iscriva a una lista d’attesa. Considerando che solo di recente Microsoft ha esteso la platea delle aziende a cui è stato concesso l’accesso a CoPilot da venti (20!) a seicento (600!), e che Google sembra essere ancor più cauta nel rilascio, non è consigliabile trattenere il fiato nell’attesa.

Va un po’ meglio per quanto riguarda Google Bard, che è disponibile da oggi in 180 paesi (ma in solo tre lingue), a patto che non siate cittadini europei. Incredibilmente, infatti, Google ha rilasciato Bard in quasi tutto il mondo, ma non nel territorio dell’Unione Europea.

È probabile che Google voglia lavorare con i regolatori Europei per evitare di ripetere i passi falsi di ChatGPT, bloccato dal Garante Italiano per un mese circa, sperando non si tratti di un messaggio trasversale verso le politiche europee degli ultimi mesi, che mirano a limitare lo strapotere dei grandi operatori del digitale nei confronti di consumatori e imprese (Digital Markets Act e Digital Services Act su tutti).