Oracle ha annunciato la disponibilità generale di MySQL HeatWave Lakehouse, che consente ai clienti di lanciare query sui dati conservati nell’object storage con la stessa rapidità delle query sui dati presenti all’interno del database. MySQL HeatWave Lakehouse supporta una varietà di formati di file di object storage quali CSV, Parquet, permette di esportare file da altri database e può combinare file dati da storage a oggetti e dati dai database transazionali MySQL nella medesima query.

Le query sui file object store sono eseguite direttamente da HeatWave senza copiare i dati nel database MySQL. Di conseguenza, MySQL HeatWave Lakehouse stabilisce nuovi standard di scalabilità e prestazioni per quanto riguarda l’elaborazione delle query, la velocità di caricamento dei dati, il tempo di provisioning del cluster e l’automazione per eseguire query sui dati nell’object storage.

Come dimostrato da un benchmark TPC-H da 10 TB, con MySQL HeatWave Lakehouse l’esecuzione di query sui dati in object storage salvati formati di file più diffusi è veloce quanto l’esecuzione di query sui dati nel database MySQL. Ciò è possibile grazie a MySQL Autopilot, una funzionalità integrata di MySQL HeatWave che offre un’automazione basata su machine learning, capace di apprendere via via dall’esecuzione delle query e migliorare quindi il piano di esecuzione delle query successive. MySQL Autopilot è un’esclusiva di MySQL HeatWave e non è disponibile in altre soluzioni presenti sul mercato.

“I team di progettazione di AMD e MySQL HeatWave collaborano strettamente per ottimizzare e sfruttare al meglio le nuove funzionalità dei nostri processori EPYC” ha dichiarato Forrest Norrod, Executive Vice President e General Manager, Data Center Solutions Business Group di AMD. “Grazie a questa collaborazione, i clienti MySQL che eseguono MySQL HeatWave su istanze OCI basate su CPU AMD EPYC godono di un netto vantaggio in termini di rapporto costi-prestazioni per i carichi di lavoro business-critical anche per le funzioni di analytics eseguite in tempo reale sulle enormi quantità di dati memorizzati nell’object storage”.

data warehouse

Come dimostrato da un benchmark TPC-H da 500 TB, le performance delle query di MySQL HeatWave Lakehouse sono:

  • 9 volte più veloci di Amazon Redshift
  • 17 volte più veloci di Snowflake
  • 17 volte più veloci di Databricks
  • 36 volte più veloci di Google BigQuery

Le prestazioni per caricare i dati memorizzati in object storage con MySQL HeatWave Lakehouse sono:

  • 9 volte più veloci di Amazon Redshift
  • 2 volte più veloci di Snowflake
  • 6 volte più veloci di Databricks
  • 8 volte più veloci di Google BigQuery

Le prestazioni di MySQL HeatWave sono il risultato della sua architettura di scale-out che consente un elevato parallelismo per eseguire il provisioning del cluster, caricare i dati e elaborare le query con un massimo di 512 nodi. Inoltre, i miglioramenti apportati a MySQL Autopilot automatizzano la creazione di metadati per i file degli oggetti e si adattano dinamicamente alle prestazioni dell’object storage sottostante, con le migliori prestazioni in qualsiasi cloud region OCI.

MySQL HeatWave è disponibile, oltre che su OCI, anche in maniera nativa su Amazon Web Services, all’interno del servizio cloud Oracle Database Service per gli utenti di MS Azure e, attraverso OCI Dedicated Region Cloud at Customer, nei datacenter dei clienti.

“Da quando esistono i Big Data si dà per scontato che le query Big Data/Lakehouse siano sostanzialmente più lente delle query transazionali” ha dichiarato Holger Mueller, VP e Principal Analyst di Constellation Research. “MySQL HeatWave pone fine a questa situazione una volta per tutte, dimostrando che le prestazioni di Lakehouse possono essere identiche alle prestazioni delle query transazionali. Grazie alla parità delle prestazioni delle query, HeatWave consente ai top manager di non preoccuparsi più della posizione in cui inserire i dati e di come eseguirne le query. L’ingrediente segreto è l’Autopilot di HeatWave che ottimizza le query”.