LUCA, l’agente AI che cerca negli archivi del basket quello che nessuno sapeva di voler cercare

Indice dell'articolo

Dal foglio Excel al linguaggio naturale
Architettura multi-agente: chi trova, chi verifica, chi scrive
L’affidabilità come requisito, una query SQL come riscontro
Stato del progetto e destinatari
Un modello replicabile oltre lo sport

Lega Basket Serie A gestisce un archivio statistico che parte dagli anni Quaranta e, dal 2008, include la cronaca play-by-play di ogni azione. Fino a oggi, quel patrimonio era accessibile solo agli interni che sapevano scrivere una query, o a chi aveva il numero di telefono giusto in Lega. LUCA – sviluppato da Impresoft 4ward su tecnologie Microsoft nell’ambito del programma di accelerazione AI L.A.B. – è il sistema progettato per sbloccare quel potenziale. Al momento è in fase beta, a uso interno: il rilascio a una platea selezionata di giornalisti e telecronisti è previsto per l’autunno 2026.

Dal foglio Excel al linguaggio naturale

Il punto di partenza del progetto è un problema di accesso, non di quantità dei dati. Massimo Cortinovis, Head of Digital di Lega Basket Serie A (LBA da qui in poi), lo ha descritto durante la presentazione: “Avere tanti dati in un database non significa poterli sfruttare al meglio. Fare un’interrogazione richiedeva competenze tecniche, e trovare un insight senza sapere fin dall’inizio cosa cercare era quasi impossibile”.

Da sinistra a destra, Stefano Deantoni (Marketing Director Infront Italy), Daniele Grandini (Chief Innovation Officer Impresoft 4Ward), Annamaria Bottero (Global Partner Solutions Lead di Microsoft Italia), Massimo Cortinovis (Head of Digital Lega Basket Serie A), Mario Castelli (Telecronista LBATV).

Il dataset di LBA copre 78 anni di competizioni: dai risultati grezzi degli anni Quaranta, ai tabellini con statistiche individuali introdotti negli anni Ottanta, fino al play-by-play completo disponibile dal 2008. Una mole di dati strutturati che, fino a oggi, era accessibile solo attraverso query manuali o fogli Excel aggiornati a mano dai singoli giornalisti e telecronisti.

LUCA opera in due modalità. In modalità proattiva esplora autonomamente l’archivio alla ricerca di correlazioni statisticamente rilevanti, senza che l’utente debba sapere cosa cercare. In modalità reattiva risponde a domande in linguaggio naturale, ma prima di elaborare la risposta riformula esplicitamente la propria interpretazione della domanda, chiedendo conferma all’utente su parametri come l’arco temporale, la competizione di riferimento o la nazionalità dei giocatori. Uno dei tanti meccanismi che riducono l’ambiguità tipica del linguaggio naturale prima ancora che inizi il processo di interrogazione, e che mirano a garantire l’accuratezza del risultato. Un parametro che, per LBA, è un valore assoluto che non può essere compromesso.

Architettura multi-agente: chi trova, chi verifica, chi scrive

La scelta architetturale più rilevante è che LUCA non è un singolo modello linguistico. Daniele Grandini, Chief Innovation Officer di Impresoft 4ward, ha enfatizzato la distinzione: “È raro trovare davvero in produzione sistemi agentici. Troviamo tanti chatbot, troviamo tanti assistenti, ma raramente agenti con una vera agency, un obiettivo, e la libertà di perseguirlo usando tutti gli strumenti disponibili”.

LUCA è una pipeline di agenti specializzati: il primo recupera i dati dal database storico; il secondo – definito da Grandini “avversario” – verifica la correttezza dell’insight e controlla la presenza di eventuali allucinazioni; il terzo genera infine il contenuto editoriale destinato ai diversi canali: blog, statistiche fornite ai giornalisti, post sociial.

La piattaforma è costruita su Microsoft Azure AI Foundry, che orchestra gli agenti e garantisce il confinamento dei dati all’interno del perimetro Azure di LBA. I modelli in uso sono della famiglia OpenAI; l’architettura astrae il layer del modello, rendendo possibile la sostituzione futura con altri provider senza modifiche strutturali (Anthropic e i modelli open source sono stati citati come opzioni già valutate).

Il costo computazionale è misurabile: la generazione di un insight complesso richiede da 5 a 20 minuti, il che rende LUCA non adatto all’uso live durante una partita nell’implementazione attuale. Gli insight vengono preparati a freddo nel corso della settimana, oppure generati su richiesta esplicita in tempi non compatibili con la diretta. In ogni caso, esiste anche un vincolo che non è tecnologio: per LBA, i dati diventano ufficiali solo dopo una revisione che avviene a fine partita.

L’affidabilità come requisito, una query SQL come riscontro

Il dettaglio architetturale più interessante per un pubblico tecnico riguarda il meccanismo di verifica dell’output. LUCA non restituisce soltanto il contenuto generato – articolo, post social, insight per telecronaca – ma accompagna ogni risultato con le query SQL che hanno prodotto i dati sottostanti. L’operatore può quindi verificare indipendentemente la correttezza dell’insight interrogando direttamente il database, senza dover accettare l’output del modello come oro colato.

È una forma di glass box pensata per un contesto editoriale in cui l’accuratezza del dato è non negoziabile: le statistiche sportive ufficiali vengono citate in diretta televisiva e pubblicate con il marchio della Lega. Il workflow prevede comunque un passaggio di approvazione umana prima che qualsiasi contenuto esca sui canali ufficiali. Fornire al supervisore gli strumenti per verificare il dato alla fonte permette di combinare velocità e rigore.

Stato del progetto e destinatari

LUCA è stato sviluppato poco più di sei mesi, a partire dal via libera ottenuto a ottobre 2025, fino al rilascio beta a maggio 2026. La fase di sviluppo AI vera e propria ha richiesto circa due mesi; il resto del tempo è stato dedicato alla normalizzazione del database storico e alla preparazione dell’architettura dati. Decenni di record eterogenei – formati diversi, standard diversi, completezza diversa – hanno richiesto un lavoro di preprocessing significativo prima di poter essere interrogati da un agente.

I destinatari diretti non sono i tifosi, che non interagiscono con l’agente: i fan riceveranno i contenuti già elaborati attraverso i canali di LBA e dei club. LUCA è pensato per giornalisti, telecronisti, staff editoriale e marketing della Lega e dei singoli club, come strumento di arricchimento del lavoro, non di sostituzione. L’obiettivo operativo è produrre una ventina di insight statistici a settimana sulle otto partite in calendario, da distribuire ai media e ai club. Il rilascio a una platea selezionata di giornalisti accreditati è previsto per l’autunno 2026, con l’obiettivo di andare a pieno regime nella stagione 2026–27.

Un modello replicabile oltre lo sport

Grandini ha insistito su un punto che va oltre il caso d’uso sportivo: il meccanismo di LUCA, cioè di un agente che esplora un dataset strutturato alla ricerca di correlazioni non ovvie, le verifica e le traduce in contenuto fruibile, è applicabile a qualsiasi contesto in cui esiste una base dati ampia e sottoutilizzata. Il settore farmaceutico, citato esplicitamente, sta già usando approcci simili per accelerare la ricerca di nuove molecole.

Il punto critico rimane la qualità e la struttura del dato di ingresso. La normalizzazione del database storico di LBA è stata una condizione necessariaper rendere il sistema funzionante. Chiunque voglia replicare l’approccio su dataset aziendali dovrà fare i conti con la stessa premessa: prima dei modelli, vengono i dati.