La guerra che sta infiammando il Medio Oriente ha trovato un obiettivo inaspettato nell’infrastruttura cloud che alimenta il mondo digitale. Amazon Web Services si è trovata improvvisamente in prima linea quando alcuni suoi data center negli Emirati Arabi Uniti e in Bahrain sono stati investiti dalle ripercussioni del conflitto tra Iran e la coalizione guidata da Stati Uniti e Israele.

L’incidente è iniziato domenica mattina, quando Amazon ha dovuto interrompere le operazioni nella zona di disponibilità mec1-az2 situata negli Emirati. Inizialmente classificata come generica interruzione, la natura dell’emergenza è emersa cinque ore dopo, quando oggetti non identificati avevano colpito la struttura scatenando scintille e innescando un incendio. Le autorità locali hanno immediatamente tagliato l’alimentazione elettrica per contenere le fiamme, lasciando migliaia di clienti nel buio digitale.

Amazon ha mantenuto un linguaggio volutamente vago parlando di “oggetti”, ma si può facilmente immaginare che si sia trattato di droni o missili. La situazione è precipitata quando, poche ore dopo il primo incidente, anche la zona mec1-az3 ha cominciato a mostrare segni di malfunzionamento a causa di interruzioni energetiche generalizzate.

Questo secondo colpo ha rappresentato un punto critico per l’architettura cloud di Amazon. Il servizio S3, spina dorsale dello storage distribuito, è infatti progettato per tollerare la perdita di una singola zona di disponibilità all’interno di una regione, ma con due zone su tre compromesse simultaneamente il sistema ha mostrato tutta la sua fragilità. I clienti hanno registrato tassi di errore elevatissimi nelle operazioni di caricamento e scaricamento dati, con applicazioni e servizi che andavano in crash ripetutamente.

I servizi AWS dopo l’attacco ai data center negli Emirati Arabi Uniti

I servizi AWS dopo l’attacco ai data center negli Emirati Arabi Uniti

Il quadro si è fatto ancora più complesso al nord, in Bahrain, dove la facility mes1-az2 ha subito quella che Amazon ha definito “un problema elettrico localizzato” lunedì mattina presto. Anche in questo caso, dietro l’eufemismo tecnico si celava un drone iraniano che aveva colpito un edificio nelle vicinanze del data center, mentre altri armamenti avevano raggiunto il quartier generale della Quinta Flotta della Marina statunitense a Manama.

In alcuni casi, gli incendi nei data center hanno attivato i sistemi antincendio automatici e gli sprinkler, progettati per spegnere le fiamme e salvare vite umane, hanno irrimediabilmente danneggiato server e apparecchiature elettroniche. L’onda d’urto si è però propagata ben oltre i confini geografici del conflitto. Snowflake ha dovuto sospendere i servizi nell’area riconducendo il blackout agli attacchi contro i data center AWS, dimostrando quanto l’ecosistema cloud possa essere vulnerabile quando i nodi critici vengono colpiti.

Amazon ha avvertito che il ripristino completo richiederà almeno 24 ore (forse di più), visto che occorre riparare strutture fisiche danneggiate, ripristinare sistemi di raffreddamento sofisticati, coordinare interventi con autorità locali in stato di allerta e verificare che ogni componente sia sicuro per gli operatori che dovranno lavorarci.

Il gigante del cloud ha inoltre informato i clienti che il conflitto in corso nella regione rende imprevedibile il contesto operativo generale in Medio Oriente, raccomandando ai clienti con carichi di lavoro in esecuzione in Medio Oriente di prendere provvedimenti immediati per eseguire il backup dei dati e, se possibile, migrare i carichi di lavoro verso altre regioni AWS.

(Immagine in apertura: Shutterstock)