Cloudflare ha annunciato l’open beta della Cloudflare Data Platform, una nuova soluzione gestita per l’ingestione, l’archiviazione e l’interrogazione di tabelle analitiche attraverso standard aperti come Apache Iceberg. Con questa mossa, l’azienda punta a ridefinire l’infrastruttura dati per il mondo enterprise, portando l’analisi dei big data nello stesso ecosistema serverless della sua Developer Platform.

La nuova piattaforma rappresenta l’evoluzione naturale di una serie di progetti avviati da Cloudflare nel corso dell’ultimo anno. A inizio 2025 era stata infatti presentata la public beta del R2 Data Catalog, un catalogo Apache Iceberg gestito costruito sopra il sistema di object storage R2. Ora, unendo Cloudflare Pipelines, R2 Data Catalog e R2 SQL, l’azienda dà vita a un’unica piattaforma integrata capace di gestire l’intero ciclo di vita dei dati analitici, dall’acquisizione all’elaborazione, fino alla consultazione in tempo reale.

Secondo gli ingegneri di Cloudflare Micah Wylde, Alex Graham e Jérôme Schneider, i dati analitici sono fondamentali per comprendere il comportamento degli utenti, le prestazioni aziendali e individuare i problemi in tempo reale. “Ma l’infrastruttura tradizionale è costosa, complessa da gestire e richiede infrastrutture cloud dedicate. La Cloudflare Data Platform è pensata proprio per essere semplice da usare, con prezzi basati solo sull’effettivo utilizzo.”

Una piattaforma unificata per l’analisi dati

Nel dettaglio, Cloudflare Pipelines si occupa di raccogliere eventi inviati attraverso Workers o richieste HTTP, elaborarli in SQL e archiviarli in tabelle Iceberg o come file su R2. L’R2 Data Catalog tiene traccia dei metadati Iceberg e gestisce in modo automatico operazioni di manutenzione come la compattazione dei dati, ottimizzando le prestazioni delle query. Infine, R2 SQL funge da motore di interrogazione distribuito e serverless, operando su dataset di scala petabyte senza richiedere infrastrutture dedicate.

Questa integrazione fa leva su un principio cardine dell’ecosistema Cloudflare, ovvero l’eliminazione dei costi di trasferimento dei dati. Come evidenzia Jamie Lord, solution architect di CDS UK, “l’assenza di costi di egress cambia radicalmente l’economia del data warehousing. Le aziende spendono milioni ogni anno solo per spostare i dati tra regioni e piattaforme per analizzarli. Con Cloudflare, tutto questo sparisce”. È un vantaggio competitivo notevole che mette direttamente in discussione la posizione dominante di AWS e Google nei carichi di lavoro analitici.

1unnamed__33_-1760101473016

L’eredità di Arroyo e la visione serverless

L’acquisizione di Arroyo da parte di Cloudflare, avvenuta sei mesi fa, ha dato i suoi frutti, visto che Arroyo è diventata parte integrante della visione alla base della Cloudflare Data Platform. L’idea è portare nel mondo dell’analisi dati un’infrastruttura completamente serverless, elastica e facile da usare, che è proprio la filosofia alla base della Cloudflare Developer Platform.

Più precisamente, Cloudflare vuole sfruttare le capacità di Arroyo per introdurre elaborazioni stateful, incluse aggregazioni, viste materializzate aggiornate in modo incrementale e join complessi. In altre parole, portare la piattaforma a gestire in modo nativo flussi di dati in tempo reale, con la scalabilità e la semplicità tipiche del cloud serverless.

Dati aperti, accesso universale

La scelta di basare Data Platform su Apache Iceberg non è casuale per Cloudflare. Si tratta infatti di uno standard aperto sempre più adottato per la gestione di grandi tabelle analitiche, che garantisce interoperabilità tra sistemi e scalabilità a livello enterprise. Combinandolo con l’infrastruttura globale di Cloudflare, che già serve milioni di richieste al secondo da centinaia di data center, la Data Platform diventa una base aperta e distribuita per qualsiasi tipo di workload analitico.

Inoltre, la futura integrazione con Logpush, le funzioni personalizzate via Workers e le aggregazioni in R2 SQL, prevista per la prima metà del 2026, renderà il sistema ancora più flessibile e modulare. Gli utenti potranno infatti creare pipeline di analisi end-to-end completamente dentro Cloudflare, senza mai esportare i dati verso servizi esterni.

Per favorire l’adozione, Cloudflare ha deciso di rendere la Data Platform gratuita durante l’open beta, includendo l’uso di Pipelines, R2 Data Catalog e R2 SQL. Restano tuttavia a pagamento lo spazio di archiviazione e le operazioni derivanti dalle query, calcolate secondo le tariffe standard di R2. È inoltre disponibile un tutorial ufficiale che guida passo dopo passo nella creazione di un sistema analitico completo basato sulle nuove componenti.