I workload AI fanno raddoppiare il volume di log e telemetria, secondo un report Dynatrace

Secondo una recente ricerca pubblicata da Dynatrace, l’incremento dei workload AI sta mettendo in seria difficoltà le infrastrutture tradizionali dedicate alla raccolta e all’analisi della telemetria. I log costituiscono una sorta di memoria operativa dei sistemi digitali. Registrano eventi, operazioni, anomalie e interazioni che consentono agli amministratori di comprendere il comportamento delle applicazioni. Nel mondo dell’AI il loro ruolo diventa ancora più importante perché permettono di ricostruire il percorso decisionale dei modelli, verificare eventuali errori, monitorare le prestazioni e garantire conformità alle normative.

La ricerca, basata sulle risposte di 450 dirigenti tecnologici a livello globale, evidenzia come il volume dei log sia aumentato mediamente del 93% nell’arco degli ultimi dodici mesi. Un incremento che riflette la crescente diffusione di modelli linguistici, applicazioni basate su agenti intelligenti, sistemi predittivi e piattaforme automatizzate che producono continuamente informazioni operative.

L’effetto immediato di questa crescita è un aumento della complessità nella gestione dei dati. Le organizzazioni si trovano a dover monitorare una quantità sempre maggiore di eventi distribuiti tra cloud pubblici, ambienti ibridi, infrastrutture on-premise e servizi SaaS. In molti casi, ogni area utilizza strumenti differenti, creando ecosistemi frammentati che rendono difficile ottenere una visione completa dello stato dei sistemi.

Secondo lo studio, le aziende impiegano in media sette piattaforme diverse per gestire log e telemetria, una situazione che genera inevitabilmente inefficienze operative. I team tecnici sono così costretti a confrontare manualmente dati provenienti da ambienti differenti, correlare informazioni raccolte da sistemi separati e verificare continuamente la coerenza delle analisi.

Crediti: Shutterstock

Questo approccio rallenta la capacità di individuare problemi, aumenta il tempo necessario per le attività di troubleshooting e riduce l’efficacia dei processi di sicurezza. L’aspetto economico contribuisce ulteriormente ad aggravare il problema. Le organizzazioni coinvolte nell’indagine dichiarano infatti una spesa media annua prossima ai 2,5 milioni di dollari per la gestione dei log. La cifra comprende raccolta dei dati, archiviazione, indicizzazione, elaborazione, reidratazione e interrogazione delle informazioni.

Di fronte a costi sempre più elevati, molte imprese hanno cominciato a ridurre la quantità di dati conservati. Il risultato, però, è sorprendente. Quasi la metà delle aziende ammette di scartare parte delle informazioni raccolte o di evitare deliberatamente la registrazione di determinati eventi e, in media, viene escluso dall’analisi circa l’86% dei dati generati dai sistemi.

Una percentuale di questa portata evidenzia un evidente paradosso. Le aziende investono milioni di dollari per ottenere visibilità sulle proprie infrastrutture digitali e, contemporaneamente, rinunciano a una quota enorme delle informazioni disponibili. Se pensiamo che l’affidabilità dell’intelligenza artificiale dipende dalla capacità di comprendere il contesto operativo, eliminare dati può significare perdere segnali critici relativi a prestazioni, sicurezza o comportamento dei modelli.

L’adozione crescente degli agenti AI rende la situazione ancora più delicata. A differenza dei software tradizionali, questi sistemi prendono decisioni sulla base di probabilità, inferenze e ragionamenti complessi. Per comprenderne realmente il funzionamento, non basta osservare un singolo log o una semplice metrica. Occorre correlare tracce distribuite, eventi, dati prestazionali e informazioni contestuali in un’unica vista coerente.

Crediti: Shutterstock

È proprio da questa esigenza che emerge il concetto di osservabilità unificata, indicato da molti operatori del settore come la naturale evoluzione del tradizionale log management. L’obiettivo consiste nel costruire una piattaforma capace di collegare automaticamente ogni informazione disponibile e trasformarla in conoscenza utilizzabile.

La ricerca mostra come quasi tre quarti degli intervistati ritengano ormai necessario adottare un approccio basato su piattaforme integrate per supportare efficacemente i workload AI. Ancora più significativo è il dato relativo all’automazione. Oltre l’80% degli intervistati considera essenziale che l’ingestione e l’elaborazione dei log avvengano in modo aperto e automatizzato, consentendo analisi in tempo reale senza i vincoli imposti dai tradizionali sistemi di indicizzazione.

Il tema assume una rilevanza particolare nel momento in cui molte organizzazioni stanno cercando di trasformare i progetti pilota basati sull’intelligenza artificiale in servizi operativi destinati alla produzione. La difficoltà non riguarda soltanto l’infrastruttura tecnologica, ma anche la fiducia nei dati utilizzati per monitorare e governare tali sistemi. Quando la telemetria risulta incompleta, frammentata o difficile da interpretare, aumenta il rischio che le iniziative AI rimangano bloccate nella fase sperimentale. Le aziende finiscono così per investire risorse significative senza riuscire a ottenere benefici concreti su larga scala.

Un altro elemento emerso dall’indagine riguarda gli sprechi generati dalla frammentazione degli strumenti. Circa un terzo delle organizzazioni paga funzionalità duplicate o scarsamente utilizzate, mentre oltre un quarto delle risorse tecniche viene assorbito dalla manutenzione e dal coordinamento di piattaforme differenti. Tempo e competenze che potrebbero essere destinati all’ottimizzazione dei modelli, alla sicurezza o allo sviluppo di nuove applicazioni basate sull’intelligenza artificiale vengono invece impiegati per mantenere operativo un ecosistema tecnologico sempre più complesso.

(Immagine in apertura: Shutterstock)

I workload AI fanno raddoppiare il volume di log e telemetria, secondo un report Dynatrace

Francesco Destri