Poco antes del mediodía del martes y durante un lapso de casi una hora, buena parte de las principales webs de todo el mundo, como la de Amazon, Twitch, New York Times, HBO Max, Hulu, Spotify, Reddit o, incluso la de EL PAÍS, comenzaron a registrar problemas de funcionamiento. En algunos casos, estas llegaron a quedar inaccesibles para muchos usuarios. La razón, uno de los eslabones secundarios del sistema, una compañía llamada Fastly, sufrió un error en sus sistemas que provocó la caída en cadena de todas las empresas a las que presta servicio.
El incidente quedaba resuelto apenas una hora después, y el pánico dejaba paso al humor y a los memes. Pero, más allá de la anécdota, el suceso volvió a poner de manifiesto la debilidad de la configuración de una red de redes sobre la que se apoyan las comunicaciones, la economía y el funcionamiento de las sociedades modernas. Máxime en un momento en el que un gran porcentaje de empresas —el 43% en España, según el INE— hacen uso del teletrabajo.
“Este suceso pone de relieve la fragilidad del sistema sobre el que se asienta internet”, asegura Igor Unane, responsable técnico de S21. La clave, asegura este ingeniero en sistemas de telecomunicaciones, “radica en la concentración de una estructura en la que “una serie de grandes fabricantes van acaparando la hegemonía”. Y Jordi Serra, profesor de la UOC, completa: “El sistema es débil porque en ocasiones depende de un solo punto en esta nube de contenido”. La clave para solucionar el problema pasa por repartir juego: que un solo eslabón no pueda provocar un fallo generalizado. El problema para ello: los costes.
En todo el mundo hay más de 1.800 millones de páginas web, según los datos de Internet Live Stats. Estas páginas necesitan los servicios alojados en la nube, es decir, en costosos servidores externos distribuidos por todo el planeta. En la nube se aloja tanto este artículo que está leyendo ahora como buena parte de los servicios a los que acceden diariamente millones de personas: Gmail, Spotify o WhatsApp, y también los aparatos que tenemos en casa, como Alexa o Google Home. Seis de cada diez sitios o servicios web en todo el mundo dependen de tan solo tres proveedores: Amazon Web Services, Microsoft Azure y Google Cloud. Y junto a estos tres gigantes, en un segundo nivel, se encuentran otras firmas llamadas de red de distribución de contenido (CDN, por sus siglas en inglés). Las más conocidas son Cloudfare, Akamai y Fastly, la causante del fallo del martes.
Una CDN es, básicamente, una red de servidores en diferentes centros de datos de todo el mundo que se dedican a almacenar de forma temporal copias de las páginas de sus clientes. La idea es evitar que la lejanía geográfica de un servicio o de sus servidores centrales, o una gran demanda de los usuarios, puedan provocar que una página tarde en cargarse o, incluso, que el sistema colapse.
Fastly publicó a las 11.58 (hora peninsular española) una incidencia que señalaba: “Actualmente estamos investigando el posible impacto en el rendimiento de nuestros servicios CDN”. A las 12.44, la compañía aseguró que el problema estaba identificado y que ya se estaba arreglando. Nueve minutos antes de las 15.00, dio por concluido el incidente. Las razones de la caída no han quedado del todo claras. La empresa afectada explicó el martes que había “identificado una configuración de servicio” que provocaba “interrupciones en los puntos de venta a nivel mundial”, por lo que había procedido a desactivar esta configuración. La empresa descartó rápidamente, eso sí, que se hubiese producido un ataque informático.
En cualquier caso, fuera cual fuera el motivo, las dudas se centraron en la vulnerabilidad de la red en su conjunto y que un solo eslabón no pueda provocar un fallo generalizado. Pero hay un problema para ello, los costes. También, que compañías como Fastly no cuenten con demasiados competidores. Para empezar, este negocio requiere de fuertes inversiones en infraestructuras, lo que limita la competencia en el sector. A las empresas, además, no les resulta rentable contar con varios proveedores. “Estas situaciones son inevitables en el momento en el que dependemos de un solo proveedor”, explica Unane, ingeniero en sistemas de telecomunicaciones. “Es como contar dos empresas para que nos pongan el teléfono y la fibra en casa, ¿para qué pagar el doble para un día que puedes quedarte sin internet?”.
No es la primera vez que se produce una caída similar. En noviembre, los servidores de Amazon Web Services registraron un fallo que llegó a provocar que dejasen de funcionar robots caseros de limpieza que necesitaban de la nube. En 2017, esta empresa registro un problema aún mayor, que duró cinco horas durante las que se propagó el caos en la red. Amazon, además de disculparse, explicó entonces que todo se debía a un error por parte de un empleado. Tecleó una errata en su código y los servidores dejaron de funcionar. “Por desgracia, uno de los signos del comando se puso mal y una gran cantidad de servidores se cayó”, señaló entonces la compañía.
Otra gran empresa sufrió una sonora caída el pasado diciembre. Durante una hora quedaron inactivos la mayoría de los servicios de Google (Google, Gmail, Google Docs, YouTube y su nube) por un problema de almacenamiento interno. El fallo afectó a millones de personas en todo el mundo que habían adoptado sus herramientas para su trabajo en remoto.
Nota: https://elpais.com/tecnologia/2021-06-09/la-caida-global-de-miles-de-paginas-alerta-sobre-la-fragilidad-de-internet.html