Il serio surriscaldamento che ha bloccato per ore AWS in Europa Centrale

Il problema è stato risolto: la temperatura del datacenter di Francoforte è tornata a livelli normali

11/06/2021 di Gianmichele Laino

L’incubo, per qualche attimo, è stato ripercorrere quanto accaduto nel marzo del 2021 al datacenter OVH: un incendio dalle proporzioni significative che ha mandato internet in panne per diverse ore, mostrando al mondo intero l’importanza di avere un backup che possa prescindere dai grandi datacenter planetari. Il problema si è verificato ancora una volta nell’Europa Centrale: nella serata di ieri, il datacenter AWS – la struttura che raccoglie i dati offrendo servizi di cloud computing – a Francoforte ha avuto un fortissimo surriscaldamento, che ha creato problemi per diverse ore a diversi siti internet.

LEGGI ANCHE > Perché dopo il disastro OVH si torna a parlare di cloud pubblico in Italia

Datacenter AWS surriscaldato, l’origine del problema

All’inizio, l’inconveniente è stato classificato come «problemi di connettività per alcune istanze EC2», dando il primo significativo segnale di cedimento intorno alle 20.30 del 10 giugno. Poi sono stati identificati ulteriori problemi: un aumento dei tassi di errore API e delle latenze per le API EC2, oltre ai già rilevati problemi di connettività per le istanze. La causa di tutto questo è stata identificata in un surriscaldamento del datacenter. In seguito all’aumento delle temperature, le attività sono state interrotte per cercare di riportare le temperature ai livelli normali. Ma per diverse ore successive a questo tentativo di risoluzione del problema, nessuno è stato in grado di entrare all’interno dell’ambiente colpito dal surriscaldamento. La situazione, pertanto, è stata gestita esclusivamente da remoto, almeno nella prima fase.

Stando ad alcune indiscrezioni, la causa del surriscaldamento sarebbe stata individuata in piccole eruzioni incendiarie a cui sono seguite fasi di rilascio di gas ipossico (che serve a togliere l’ossigeno agli incendi). Di conseguenza, per diverso tempo la struttura è rimasta inaccessibile e – di conseguenza – si è dovuto aspettare l’intervento dei vigili del fuoco prima di entrare all’interno della struttura. Il surriscaldamento, a quanto pare, ha danneggiato alcune infrastrutture interne, per cui potrebbero esserci problemi anche il giorno dopo rispetto all’incidente che si è verificato.

La questione del surriscaldamento dei datacenter si pone ancora una volta dopo quanto accaduto a marzo a OVH. Attualmente, per la gestione di grandi quantità di dati di rete, sembrano essere più efficaci i sistemi che fanno a meno delle concentrazioni in datacenter, prediligendo una struttura a rete che – in caso di disfunzione – può al massimo interessare uno snodo, ma che mai andrebbe a compromettere una intera area di riferimento.

Share this article
TAGS