Un disservizio AWS ha paralizzato mezza internet

Un blackout massiccio ha colpito nelle scorse ore Amazon Web Services (AWS), causando disservizi su scala globale e interrompendo persino il funzionamento del sito principale Amazon.com. L’incidente (uno dei più gravi degli ultimi anni) ha evidenziato in modo drammatico quanto la dipendenza dal cloud pubblico sia ormai un elemento strutturale dell’economia digitale, mettendo offline simultaneamente servizi consumer, piattaforme mission-critical e perfino sistemi governativi. L’evento è stato localizzato nella regione US-EAST-1, situata in Virginia settentrionale, storicamente il cuore operativo dell’infrastruttura AWS, da cui dipendono numerosi servizi globali.
Secondo quanto riportato sulla AWS Health Dashboard, i primi segnali dell’anomalia sono comparsi con un aumento significativo dei tassi di errore e della latenza su vari servizi. Col passare dei minuti, la criticità si è trasformata in un vero effetto domino e AWS stessa ha confermato errori diffusi nelle richieste verso DynamoDB (uno dei principali database NoSQL gestiti dal gruppo), con ripercussioni trasversali anche su AWS Identity and Access Management (IAM), sul routing interno e sugli endpoint globali.
I tecnici Amazon hanno individuato un possibile punto d’origine legato alla risoluzione DNS del servizio DynamoDB. In un’infrastruttura cloud, le chiamate ai servizi avvengono attraverso endpoint programmabili e quando la risoluzione DNS fallisce o genera risposte errate, l’intera catena applicativa non è più in grado di instradare correttamente i dati. Nel caso di AWS, questo ha significato l’impossibilità per applicazioni e servizi di autenticarsi, accedere alle risorse o eseguire query essenziali.
L’effetto è stato devastante. La lista dei servizi coinvolti è lunga e comprende nomi come McDonald’s, Disney+, Snapchat, Signal, Roblox, Verizon, Fortnite, Venmo, Reddit, Coinbase, Duolingo, Hulu, oltre a piattaforme emergenti come Perplexity AI. Anche dispositivi smart come gli speaker Alexa e i campanelli Ring hanno smesso di funzionare, dimostrando come la dipendenza dal cloud non riguardi più solo applicazioni digitali ma anche la domotica e l’intero ecosistema IoT.
Non sono stati risparmiati neppure i servizi bancari e governativi. Nel Regno Unito, le app del Lloyds Banking Group sono finite offline e anche l’infrastruttura informatica dell’HMRC (l’agenzia delle entrate britannica) ha registrato pesanti rallentamenti e blocchi. Molti cittadini e imprese si sono ritrovati senza accesso a operazioni essenziali, con conseguenti disagi operativi.
Sebbene AWS abbia parlato di “significativi tassi di errore” e “latenza aumentata”, in realtà l’impatto è stato ben più esteso. US-EAST-1 è la regione più critica nel portfolio AWS, dal momento che ospita non solo migliaia di clienti enterprise ma funge da nodo centrale per servizi globali come IAM, CloudFront, Route 53 e DynamoDB global tables. Questo significa che un guasto localizzato in questa regione può propagarsi rapidamente in tutto il mondo, come effettivamente accaduto.
Secondo esperti del settore, eventi di questo tipo rappresentano una minaccia crescente per la resilienza digitale. Il problema non è tanto la vulnerabilità tecnica (sempre possibile), quanto la concentrazione di potere infrastrutturale. Quando un singolo provider gestisce una quota così significativa del traffico Internet mondiale, ogni interruzione si trasforma inevitabilmente in un evento sistemico.
Al momento in cui AWS ha diramato l’ultimo aggiornamento, i tecnici erano ancora al lavoro su più fronti paralleli per accelerare il ripristino. Amazon non ha fornito ulteriori commenti, limitandosi a rimandare alla propria dashboard ufficiale e confermando che verranno rilasciati ulteriori dettagli non appena disponibili.