AI readiness, il divario tra percezione e realtà delle aziende italiane nel report di Cloudera

Indice dell'articolo

Integrazione, qualità, accesso ai dati e il ROI che non arriva
AI Act e sovereign AI: il ritardo italiano e la risposta architetturale
Data lineage: il pilastro che quasi nessuno ha costruito

Tra le organizzazioni europee la convinzione di essere pronte all’AI corre più veloce della reale maturità delle infrastrutture dati. In Italia il fenomeno è ancora più marcato. Secondo il Data Readiness Index pubblicato da Cloudera, il 91% dei responsabili IT italiani si dichiara fiducioso nella propria infrastruttura, ma solo il 2% lavora con dati completamente governati e appena il 16% ha una integrazione completa tra le proprie fonti. Come è possibile tutto ciò?

Lo studio, commissionato da Cloudera e condotto da Researchscape su 1.270 responsabili IT a livello globale (312 in area EMEA, 55 in Italia, tutti in aziende con più di 1.000 dipendenti), restituisce un paradosso ricorrente. In area EMEA il 91% delle organizzazioni dichiara di disporre di un’infrastruttura dati in grado di sostenere le proprie priorità strategiche nei prossimi due–tre anni e il 92% di avere una strategia dati ben definita; ma solo il 26% sostiene di operare con dati completamente governati, mentre quasi tre quarti (74%) ammettono che le iniziative operative sono frenate da limiti di performance, silos persistenti e qualità del dato non uniforme.

Come di consueto quando si parla di maturità tecnologica, sul campione italiano i numeri si fanno più severi. Solo il 56% dichiara di avere una strategia dati ben definita e oltre un terzo (38%) indica nella mancanza di sostegno dei vertici un ostacolo concreto all’uso efficace dei dati. La quota di chi opera in ambienti completamente governati scende al 2%, contro circa il 30% segnalato in Francia e una percentuale vicina al 40% in Germania.

Yari Franzini, Group Vice President Southern Europe di Cloudera

“C’è una percezione molto elevata a livello di management dell’importanza di investire in AI, parliamo di più del 90% delle aziende” – ha spiegato Fabio Pascali, Regional Vice President Italy, Greece and Cyprus di Cloudera – “ma d’altra parte c’è una bassa governance su tutto quello che è il mondo Data e AI: controllo dei dati, qualità del dato, processi, organizzazione. C’è un gap enorme”.

Yari Franzini, Group Vice President Southern Europe di Cloudera inquadra il fenomeno in chiave europea: “La vera difficoltà per le organizzazioni europee non sta nell’adozione dell’AI, ma nella capacità di renderla operativa oltre la fase sperimentale. L’AI è efficace solo quanto i dati che la alimentano”.

Integrazione, qualità, accesso ai dati e il ROI che non arriva

Fabio Pascali, Regional Vice President Italy, Greece and Cyprus di Cloudera

Sotto l’AI ci sono i dati, quindi, e qui i responsabili IT italiani sono i primi a riconoscere i propri limiti. Solo il 16% dichiara di avere una completa integrazione delle fonti dati, mentre il 53% si dice “abbastanza” integrato. Solo il 26% afferma di avere accesso immediato a tutti i dati indipendentemente dal formato, un dato che pesa soprattutto sulle aziende manifatturiere ricche di dati IoT non strutturati. Ancora più basso il dato sull’accesso self-service: appena il 18% lo ha implementato pienamente.

“Probabilmente c’è anche una certa autocritica”, ha osservato Pascali. “Avere una completa integrazione è molto difficile, soprattutto se hai una quantità di sorgenti, sistemi e soluzioni all’interno di aziende grandi e molto eterogenee. Ma se l’AI che sta sopra deve nutrirsi di quei dati, l’integrazione è importante”.

Quando lo studio chiede ai responsabili IT cosa stia frenando il ritorno sugli investimenti in AI, emergono tre cause ricorrenti.

La prima è la qualità del dato: in Italia la citano il 24% dei rispondenti, contro il 18% della media EMEA.
La seconda è la persistenza dei silos: l’AI lavora su una porzione parziale del patrimonio informativo, i modelli vengono allenati su viste frammentate, le organizzazioni si ritrovano a costruire piccoli modelli verticali (uno per HR, uno per la produzione, uno per il customer care) senza poter spalmare gli investimenti su una base ampia.
La terza è la voce costi, che il 16% dei rispondenti italiani indica come causa di un ROI insufficiente.

Il modello a token tipico delle soluzioni cloud è “sostenibile quando si parte con qualche POC”, ha spiegato Pascali, “ma quando si scala diventa significativo: i costi non tornano e aumentano in modo esponenziale”. Una conseguenza paradossale, segnalata dagli stessi manager Cloudera, è la decisione di alcune aziende di razionare l’uso dell’AI assegnando budget di token ai dipendenti, fino a esaurimento.

C’è poi un nodo culturale che i due manager non hanno nascosto: una parte significativa delle organizzazioni sceglie scorciatoie problematiche. “Le aziende fanno finta di non vedere”, ha sintetizzato Pascali a proposito del fatto che molti progetti di fine-tuning e inferenza vengono eseguiti su servizi cloud generici esportando dati sensibili, scaricando la responsabilità sui team che hanno avviato l’operazione. Un approccio che funziona in fase di POC ma genera problemi di compliance non appena si tenta di scalare.

AI Act e sovereign AI: il ritardo italiano e la risposta architetturale

La scadenza di agosto 2026 prevista dall’AI Act trova la maggior parte delle aziende EMEA in ritardo. “Sono in ritardo per certi versi perché si è cresciuti in un’ottica best of breed, con dello Shadow IT che ha preso dentro anche Data e AI”, ha spiegato Yari Franzini, Group Vice President Southern Europe di Cloudera. “Continuiamo a ragionare in termini di silos, che poi presuppongono un costo di integrazione notevole”. Franzini cita anche un altro freno, di natura organizzativa: “vedo le aziende italiane di grandi dimensioni in continua riorganizzazione, con una frequenza maggiore rispetto a quella che vedo all’estero. E ogni riorganizzazione significa nuovi incarichi, nuovi obiettivi nel breve termine. Manca ancora una volta la proiezione a futuro”.

Sul tema della sovranità del dato, la Francia è considerata in vantaggio: il governo locale ha spinto in modo più deciso verso architetture sovrane, e “diversi player sovereign sono ben posizionati e stanno diventando partner Cloudera”, ha riferito Franzini. In Italia la stessa evoluzione è più lenta, con qualche segnale di accelerazione da provider come Aruba, Seeweb e operatori telco. I primi settori che stanno spingendo su questo terreno sono pubblica amministrazione (centrale in particolare), finance e sanità: ambiti in cui la Private AI – cioè il rimpatrio dei modelli su infrastruttura interna consente di passare da una logica di costi per token a una basata sul consumo di infrastruttura.

La risposta di Cloudera passa per un’architettura Open Data Lakehouse basata sul formato tabellare open source Apache Iceberg, definita da Pascali “l’esperanto del mondo dei dati”. L’obiettivo dichiarato è permettere ai clienti di spostare i dati tra hyperscaler diversi o riportarli on-premise senza essere vincolati a un fornitore specifico, riducendo il rischio di lock-in. Una scelta che la pubblica amministrazione italiana, partita da posizioni storicamente on-premise, sembra apprezzare: nei mesi scorsi sono stati registrati progetti pubblici partiti in modalità ibrida e poi rientrati interamente on-prem. “Non pensiamo che la governance sia un freno a mano tirato sull’innovazione”, ha aggiunto Franzini. “Soluzioni come la nostra possono garantire una frenata assistita”.

Data lineage: il pilastro che quasi nessuno ha costruito

Tra i dati più significativi del report c’è la distanza tra consapevolezza e implementazione sul fronte del data lineage e del data catalog, che sono gli strumenti che rendono verificabile l’origine e l’autenticità dei dati, fondamentale quando l’IA introduce elementi di incertezza.

Oltre il 90% delle aziende riconosce l’importanza di tracciare l’origine, le trasformazioni e gli accessi al dato lungo l’intera pipeline, ma solo il 47% dichiara di avere implementato strumenti di lineage o catalog di livello base. “Tra il dire e il fare c’è di mezzo la complessità”, osserva Pascali: “Senza uno strumento in grado di fare lineage in modo automatico e cross-platform non si va da nessuna parte, soprattutto quando si lavora su centinaia o migliaia di sistemi con trasformazioni stratificate nel tempo”.

Su questo terreno Cloudera ha investito con l’acquisizione di Octopai, completata a fine 2024 e oggi rebrandizzata come Cloudera Data Lineage. La piattaforma si interfaccia con oltre 60 strumenti di mercato (tra cui Snowflake, Databricks, Oracle, SAS, Qlik, Power BI e Tableau) ed estrae automaticamente i metadati ricostruendo i flussi dati end-to-end. È un terreno su cui Cloudera prova a differenziarsi da competitor che, secondo i due manager, faticano a operare in modo automatico e cross-platform fuori dalle proprie piattaforme native.