Nella giornata di ieri, 12 giugno, un guasto ai sistemi di gestione delle identità e degli accessi (IAM) ha innescato una delle più vaste interruzioni recenti nei servizi di Google Cloud. L’incidente è stato reso pubblico da Google alle 11:46 ora del Pacifico (PDT), quando ha segnalato che oltre 40 sedi e 26 servizi risultavano “compromessi” a causa del problema. Tra i servizi coinvolti figuravano componenti chiave come Cloud Console, Cloud Storage e Cloud SQL e ciò ha reso impossibile per gli utenti accedere anche agli strumenti di diagnosi e monitoraggio.

La console di amministrazione, infatti, era inaccessibile, rendendo particolarmente complesso per aziende e sviluppatori comprendere l’entità e la natura del malfunzionamento che stava colpendo altri componenti critici dell’infrastruttura cloud.

Comunicazioni contraddittorie e risoluzione parziale

Alle 12:30 PDT, Google ha annunciato che l’incidente era stato mitigato nella maggior parte delle regioni, ad eccezione della zona us-central1, che fa riferimento ai data center situati in Iowa. Tuttavia, appena undici minuti dopo, alle 12:41, la stessa Google ha ammesso che “i clienti stanno ancora riscontrando diversi gradi di impatto sui singoli prodotti Google Cloud”, segnalando quindi una persistenza dei problemi in alcune aree del servizio.

Nonostante le difficoltà, l’azienda ha assicurato che i team di ingegneri responsabili delle varie componenti cloud erano pienamente impegnati nelle operazioni di ripristino, avendo già identificato l’origine del guasto.

Effetto domino: coinvolti anche Cloudflare, Discord e Spotify

Le ripercussioni del blackout non si sono fermate ai confini dell’ecosistema Google. Anche servizi terzi che si appoggiano all’infrastruttura di Mountain View hanno infatti iniziato a sperimentare problemi. Tra questi figura Cloudflare, il noto provider di servizi di sicurezza e distribuzione dei contenuti, che ha segnalato anomalie già alle 11:19 PDT, quasi mezz’ora prima del primo aggiornamento ufficiale di Google. Cloudflare ha poi chiarito che “un numero limitato di servizi” da essa gestiti si basano su Google Cloud e sono stati temporaneamente colpiti, ma i suoi servizi principali non sono stati compromessi.

Google_Cloud_logo_720

Alle 12:12, Cloudflare ha osservato segni di ripresa, pur avvisando i clienti che sarebbero potuti persistere “errori intermittenti” dovuti a sistemi in fase di riavvio e al riempimento delle cache.

Nel medesimo arco temporale, anche Discord, Spotify e Azure hanno riportato malfunzionamenti secondo i dati del sito Downdetector. Sebbene non sia stato confermato un legame diretto, è probabile che la combinazione del down di Google e dei suoi partner abbia generato un effetto domino sull’intera rete di servizi cloud interconnessi, alimentando un blackout digitale più esteso di quanto inizialmente previsto.

Alla scoperta delle cause

La portavoce della divisione cloud di Google ha diffuso un comunicato laconico ma significativo: “Stiamo attualmente indagando su un’interruzione di servizio che interessa alcuni prodotti Google Cloud. Invitiamo a consultare il nostro pannello di stato pubblico per aggiornamenti in tempo reale.” La mancanza di dettagli specifici ha alimentato incertezza tra clienti enterprise, sviluppatori e partner commerciali che fanno affidamento sull’affidabilità delle piattaforme cloud per la continuità operativa. Va notato che AWS, inizialmente menzionata in alcune segnalazioni, ha chiarito di non aver subito alcuna interruzione, smentendo quindi qualsiasi coinvolgimento diretto.

L’interruzione dei servizi Google Cloud ha dimostrato, ancora una volta, quanto sia delicato l’equilibrio dell’attuale ecosistema cloud globale. Un singolo malfunzionamento a livello di autenticazione e accesso può infatti causare un effetto a catena che si propaga ben oltre i confini del fornitore primario, coinvolgendo partner e clienti in tutto il mondo. Se da un lato Google ha risposto con relativa rapidità, dall’altro la gestione comunicativa iniziale, frammentaria e a tratti contraddittoria, ha lasciato spazio a incertezze in un settore dove la fiducia e la trasparenza sono fondamentali.

Resta da vedere se nei prossimi giorni Google pubblicherà un’analisi tecnica approfondita dell’accaduto, come è consuetudine in questi casi, per chiarire cause e misure adottate per evitare il ripetersi di simili episodi.

(Immagine in apertura: Shutterstock)