Con AI Accelerator, Qumulo e Cisco vogliono creare "liquidità delle GPU" sul multi cloud

L’industria dell’AI enterprise sta bruciando capitali a una velocità allarmante senza rendersene conto. Uno studio recente ha messo in luce che l’utilizzo medio delle GPU nelle imprese si ferma a un impressionante 5%, un dato che dovrebbe far tremare i CFO di ogni azienda. Significa infatti che centinaia di miliardi di dollari di infrastruttura di calcolo accelerato restano ferme per il 95% del tempo.

Per risolvere questa situazione paradossale, Qumulo ha annunciato Cloud AI Accelerator, un approccio radicalmente nuovo all’infrastruttura AI enterprise che rende i dati distribuiti dell’azienda accessibili in tempo reale alle risorse GPU attraverso regioni, cloud e ambienti ibridi senza replica, ritardi di staging o compromessi sulla consistenza dei dati.

In pratica, invece di forzare le imprese a spostare dataset massicci ovunque le GPU si trovino disponibili, Cloud AI Accelerator inverte la logica ed elimina i colli di bottiglia della gravità e dello staging dei dati che causano l’inattività delle GPU fin dall’inizio, permettendo alle imprese di costruire un’infrastruttura AI agile che si adatta in minuti alla disponibilità GPU variabile attraverso cloud e regioni.

L’architettura di Cloud AI Accelerator crea quella che Qumulo chiama “GPU liquidity” attraverso un data fabric intelligente che integra Qumulo Cloud Native, Qumulo Cloud Data Fabric e Qumulo NeuralCache attraverso ambienti on-premises, edge e multi-cloud. Questa infrastruttura permette alle imprese di eseguire workload ovunque la capacità GPU sia disponibile, piuttosto che ovunque i dati si trovino intrappolati fisicamente, trasformando la caccia disperata alle GPU da un problema logistico costoso in un’operazione di scheduling flessibile, consegnando qualsiasi dataset aziendale in tempo reale a qualsiasi farm GPU in qualsiasi cloud pubblico o privato.

Crediti: Shutterstock

La soluzione di Qumulo permette anche di collegare fluidamente e in sicurezza sistemi Qumulo on-premises o cloud-native a Microsoft AI Foundry, AWS Bedrock e Google Vertex AI senza duplicare i dati. Inoltre, le aziende possono:

Catturare la capacità GPU globale eseguendo workload ovunque e quando la capacità diventa disponibile attraverso qualsiasi regione, cloud o zona di disponibilità
Eliminare i ritardi di staging che durano settimane e mantengono l’infrastruttura GPU inattiva prima che i workload di training o inference inizino
Evitare di mantenere silos di storage isolati e replicati in ogni ambiente dove le GPU potrebbero essere recuperate
Ridurre drasticamente i costi delle GPU inattive eliminando la fase di carico pesante nello storage flash collegato alle GPU

Cisco gioca un ruolo fondazionale nell’architettura di Cloud AI Accelerator. Cisco Unified Computing System fornisce infrastruttura di calcolo AI enterprise scalabile per distribuzioni on-premises e ibride, mentre il networking di Cisco abilita lo spostamento sicuro e a bassa latenza dei dati attraverso ambienti AI ibridi e multi-cloud. Qumulo Cloud AI Accelerator è disponibile ora su AWS, Azure, Google Cloud e Oracle Cloud Infrastructure, con supporto per distribuzione ibrida su Cisco UCS in ambienti on-premises.

Con AI Accelerator, Qumulo e Cisco vogliono creare “liquidità delle GPU” sul multi cloud

Francesco Destri