Centro de datos de AWS en Oregón (EE. UU.)

Centro de datos de AWS en Oregón (EE. UU.)

Noticias y novedades

Amazon revela la causa de la masiva caída de AWS que dejó sin funcionar desde bancos a Fortnite, Alexa o Perplexity

Amazon Web Services publicó una explicación detallada de lo ocurrido con el apagón del lunes, que tiene que ver con una automatización defectuosa.

Más información: El efecto dominó de la caída de Amazon Web Services: por qué fallaron miles de webs en todo el mundo al caer sus servidores

Publicada

El lunes pasado nos levantamos con medio internet caído y algunas de las plataformas más importantes sin servicio. Ahora Amazon Web Services ha revelado la causa del apagón que duró horas.

Entró en detalles de lo que fue un complejo fallo en cascada provocado por un raro error de software en uno de los sistemas más críticos de la empresa.

Es decir, que ni tuvo que ver con un ataque externo ni con un fallo de hardware, y más bien con una automatización defectuosa en sus sistemas internos.

AWS dijo que los clientes no fueron capaces de conectarse a DynamoDB, su sistema de base de datos donde los clientes de AWS almacenan sus datos, debido a un "defecto latente en el sistema de gestión automatizado de DNS (sistema de nombres de dominio) del servicio".

DynamoDB mantiene cientos de miles de registros DNS. Usa la automatización para monitorizar el sistema que se asegura de que los registros son actualizados frecuentemente.

Otra de sus tareas es añadir capacidad adicional si se requiere, gestiona los fallos de hardware y que el tráfico se distribuya eficientemente.

La causa raíz del problema, según AWS, fue un registro DNS vacío para la región del centro de datos US-East-1 con sede en Virginia. El error no se pudo reparar automáticamente y fue necesaria la intervención manual del operador para corregirlo.

Un operador en el centro de datos de AWS en Oregón (EE. UU.)

Un operador en el centro de datos de AWS en Oregón (EE. UU.)

AWS dijo que tuvo que desactivar el planificador de DNS DynamoDB y la automatización del generador de DNS en todo el mundo mientras corrige las condiciones que provocaron la interrupción y agrega protecciones adicionales.

Como resultado, el fallo causó apagones para otras herramientas de AWS y comenzó la caída en cascada de plataformas que usan diariamente millones de personas como Fortnite de Epic Games, la propia Alexa u otras como Perplexity, Dropbox, Zoom o Trello.

Servicios bancarios y compañías como Ring se encontraron entre las más de 2.000 compañías afectadas por el apagón, según Downdetector, que reportó más de 8,1 millones de incidencias de usuarios en todo el mundo.

A lo largo del día se fueron restableciendo ciertos servicios, pero el impacto del apagón se sintió en todo el planeta.

Según The Guardian, clientes de Eight Sleep, una compañía de camas inteligentes que se conecta a internet para controlar la temperatura y la inclinación, fueron incapaces de ajustar la cama o la temperatura.

Matteo Franceschetti, jefe ejecutivo de la compañía, pidió perdón a sus clientes en X (antes Twitter) y estos días atrás se lanzó una actualización de sus servicios que permitiría a los usuarios controlar las funciones críticas vía Bluetooth ante otro evento similar.

Las disculpas de Amazon

Amazon se disculpó y reconoció los graves problemas generados causados por el apagón de servicios, plataformas y webs.

Estas fueron sus palabras: "Si bien tenemos un sólido historial de operación de nuestros servicios con los más altos niveles de disponibilidad, sabemos lo críticos que son nuestros servicios para nuestros clientes, sus aplicaciones y usuarios finales, y sus negocios".

La dependencia de tantas compañías, servicios, plataformas y webs, en un momento actual en el que multitud de gadgets o dispositivos son "inteligentes" y necesitan internet para funcionar, muestra las debilidades de un mundo cada vez más digital.

Si AWS suma más del 30 % del mercado global del cloud, básicamente es uno dominado por solo tres compañías. Si los servicios en la nube de alguna caen, de nuevo el apagón será masivo.