- Fallo en AWS provocó interrupciones globales y dejó a Snapchat y otros servicios con problemas de acceso
- La causa se vinculó a un incidente de DNS y a errores en servicios de la región US-EAST-1
- AWS aplicó mitigaciones y reportó señales de recuperación horas después
- El incidente reabre el debate sobre la dependencia de pocos proveedores cloud
Una interrupción en la infraestructura de Amazon Web Services (AWS) provocó este lunes fallos generalizados en múltiples servicios online, con Snapchat entre los más afectados, además de plataformas sociales, herramientas de trabajo y videojuegos. La incidencia, con epicentro en la región US-EAST-1, se dejó notar en numerosos países y a distintas horas.
Horas después del inicio del problema, AWS indicó que el fallo subyacente de DNS estaba mitigado y que la mayoría de operaciones volvían a la normalidad, aunque advirtió de demoras y peticiones acumuladas mientras se completaba la recuperación. Plataformas de seguimiento de incidencias como Downdetector registraron millones de reportes a nivel global.
Cronología del incidente
En las primeras horas de la madrugada en la costa este de EE. UU., AWS informó que investigaba picos de latencia y tasas de error elevadas en varios servicios. Poco después, la compañía señaló indicios de que el problema afectaba a APIs de DynamoDB en la región US-EAST-1, un punto clave de su red.
Con el avance de las tareas, AWS comunicó la aplicación de medidas de mitigación iniciales y empezó a observar señales de mejora en algunos servicios. A media mañana, el proveedor habló de una recuperación significativa, si bien persistían errores puntuales durante el restablecimiento.
Pasado el mediodía, la firma aseguró que el origen DNS del incidente estaba controlado, y que la operativa de la mayoría de servicios funcionaba con normalidad. No obstante, avisó de posibles limitaciones temporales mientras se procesaba el atasco de solicitudes generado durante la caída.
Servicios afectados (con Snapchat en el foco)
La interrupción alcanzó a una amplia lista de plataformas. Además de Snapchat, usuarios reportaron fallos en servicios como Reddit, Duolingo y más servicios, Zoom, Roblox, Fortnite, Signal, Ring y Alexa, entre otros. También se registraron incidencias en pagos y banca online de entidades como Lloyds o Halifax, y en sitios de medios internacionales.
En España, numerosos usuarios percibieron errores de acceso y lentitud en apps populares y herramientas en la nube durante la mañana. Aunque el impacto varió según regiones y servicios, el patrón común fue la intermitencia y la incapacidad puntual de iniciar sesión o completar acciones básicas.
Qué falló: el DNS y su efecto dominó
El Sistema de Nombres de Dominio (DNS) actúa como la guía telefónica de internet: traduce nombres de dominio en direcciones IP para conectar a los usuarios con los servicios. Cuando el DNS se ve afectado, los navegadores y apps “pierden el mapa” y no encuentran el destino correcto, generando errores y tiempos de espera.
Expertos consultados explican que incidencias de este tipo pueden originarse en mantenimiento, configuraciones erróneas o fallos de red, sin indicios de un ciberataque en este caso. La combinación de problemas en DNS y componentes críticos como APIs de bases de datos puede desencadenar una interrupción de amplio alcance.
Efectos en usuarios y empresas
Más allá de las caídas visibles en Snapchat y plataformas de ocio, muchas compañías sufrieron interrupciones en herramientas de productividad y comunicación. Usuarios reportaron cierres inesperados en videollamadas, errores al iniciar sesión y fallos en la entrega de notificaciones, además de problemas en transacciones digitales como pagos o envíos de dinero.
Incluso servicios de Amazon como Alexa o Ring notaron el golpe, y algunas webs mostraron mensajes de error mientras duraba la incidencia. En administraciones y empresas, herramientas en la nube quedaron temporalmente inaccesibles, lo que impactó en la operativa diaria.
Riesgos y lecciones de la dependencia del cloud
La escala del incidente vuelve a evidenciar la concentración de infraestructuras en manos de unos pocos proveedores cloud. Con gran parte de internet sustentada por plataformas como AWS, Microsoft Azure o Google Cloud, un fallo en un componente crítico puede provocar cortes en cascada a escala global.
Especialistas subrayan la necesidad de diseños resilientes: redundancias multirregión, copias de seguridad y planes de continuidad. Aunque estas medidas no eliminan el riesgo, sí acortan la recuperación y reducen el impacto para servicios esenciales cuando se producen incidentes de gran alcance.
Situación actual y próximos pasos
Según las últimas comunicaciones, la mayoría de servicios de AWS opera con normalidad y los ingenieros continúan procesando la cola de solicitudes acumuladas. Registros de seguimiento público reportaron más de cuatro millones de incidencias durante el pico, con una clara tendencia a la baja conforme avanzaron las mitigaciones.
La compañía indicó que decenas de servicios internos se vieron afectados durante la caída. Como suele ocurrir tras un apagón relevante, pueden aparecer repercusiones residuales mientras se estabiliza el ecosistema y se valida el comportamiento de las dependencias.
Lo ocurrido con Snapchat y otras plataformas muestra cómo un fallo en la nube puede atravesar diferentes sectores en cuestión de minutos; pese a la rápida mejora, la resiliencia del cloud y la diversificación de proveedores vuelven al primer plano para reducir la exposición a interrupciones futuras.
Editor profesional de Tecnología y Software