El comportamiento de Internet tras una gran catástrofe es un tema controvertido y del que normalmente no se dispone de datos fiables, debido al celo de las compañías proveedoras de servicios (ISP) en ofrecer datos. A pesar de ser una red diseñada para resistir a una catástrofe, gracias a su elevado grado de redundancia y al establecimiento automático de rutas alternativas en casos de fallos de los equipos o cortes en los enlaces, todavía puede presentar problemas serios como el fallo de equipos críticos para el funcionamiento de la red o la saturación de los enlaces que sobreviven a la catástrofe.
En el año 2003, realicé una ponencia titulada “Internet como herramienta de comunicación para emergencias”, en el seno del Foro Euromediterráneo sobre Prevención de Catástrofes, en la que traté de explicar el funcionamiento del núcleo de la red ante una gran catástrofe. A pesar de que el núcleo de Internet está muy preparado para soportar una situación de estas características, los accesos de los usuarios normalmente son mucho más vulnerables, dificultando o impidiendo las comunicaciones en las zonas afectadas.
En el año 2007, realicé otra ponencia titulada “Técnicas de priorización del tráfico de emergencias en Internet”, dentro de las Jornadas Técnicas sobre Telecomunicaciones de Emergencia organizadas por la Escuela Nacional de Protección Civil. En esta segunda ponencia, se exponían algunas técnicas para tratar de asegurar al menos el tráfico de los organismos gestores de las emergencias, haciendo hincapié en su dificultad de implementación al depender de multitud de operadoras de Internet que deberían llegar a acuerdos.
José M. Piquer, profesor del Departamento de Ciencias de la Computación de la Facultad de Ciencias Físicas y Matemáticas de la Universidad de Chile, ha escrito un artículo sobre el comportamiento de Internet en Chile tras el terremoto del pasado 27 de febrero, en el blog “Bits, Ciencia y Sociedad”, que por su interés reproduzco aquí íntegramente.
Terremoto 2010: ¿Internet resistió bien la prueba?
Cuando ocurre una catástrofe nacional como el pasado terremoto, se sabe y espera que las líneas telefónicas colapsen y sea imposible hablar por teléfono (sea fijo o móvil) con el lugar del desastre. Esto se debe al diseño mismo del sistema telefónico, que transa la disponibilidad del servicio por la calidad garantizada de cada llamada. Ese mismo modelo fue el causante de la lenta muerte de la telefonía y el auge de Internet en su reemplazo siendo el medio de comunicación predominante: la gran gracia de Internet es no garantizar calidad de servicio y, en consecuencia, permitir no denegar nunca el servicio, por mucha congestión que haya.
El sismo de febrero puso a prueba esa hipótesis: la teoría indicaba que Internet debía ser el primer medio de comunicación en funcionar, permitiendo a los familiares encontrarse para saber unos de otros e informarse de lo que estaba ocurriendo, mucho antes que la telefonía. Y casi fue así: durante los primeros 10 minutos, y aproximadamente media hora después del terremoto, Internet, incluida la banda ancha móvil, funcionó muy bien, mientras que el sistema telefónico fue totalmente inútil. Pero algo falló: pasado un tiempo bastante breve Internet completo empezó a fallar: la banda ancha móvil no llegaba a ninguna parte, los accesos a Internet fijos dejaron de operar e incluso la conectividad internacional de Chile falló. En nuestros registros en NIC Chile, donde los servidores operaron en forma continua y con conexión permanente a nuestros proveedores, quedó claro que hubo muy bajo tráfico entre las 4.00 y las 9.00 horas, e incluso bastante bajo hasta el mediodía, siendo anormal por unas 24 horas más. Más relevante aún es que nuestros servidores de DNS secundarios de .CL en Estados Unidos, Brasil y Europa aumentaron enormemente su tráfico, reemplazando a los servidores en Chile que estaban, al parecer, inalcanzables tanto dentro de Chile como fuera. En sus respuestas oficiales, ninguno de nuestros proveedores ha expresado haber tenido fallas inexcusables y la posición oficial del país parece ser que Internet se comportó bien.
Pero en mi opinión, reprobamos el test. No hay ninguna razón valedera para que los enlaces internacionales no hayan operado bien, ni para que la conectividad nacional fallara y demorara más de 24 horas en normalizarse. Por el patrón de fallas, parece deberse a las muertes paulatinas de las UPS a medida que pasaba el tiempo y la energía eléctrica no se restablecía. La primera falla mayor ocurrió justo media hora después del sismo, hecho que hace muy improbable que haya sido un corte de fibra, lo que hubiera pasado a la misma hora del terremoto. La primera recuperación sucedió cerca del mediodía, que calza justo cuando la luz volvió al centro de Santiago. La mayoría de las historias que he escuchado son coherentes con estas fallas: incluso la ONEMI explica que no recibió la alerta de tsunami desde Estados Unidos porque su acceso a Internet murió como a los 15 minutos luego del terremoto. En casos puntuales, la conectividad funcionó bien y algunos sitios tuvieron acceso a Internet casi permanente. Pareciera que la caída generalizada de varios equipos generó una inestabilidad mayor en las rutas dejando a la mayoría del Internet nacional fuera de operación, pero manteniendo algunas islas conectadas en forma estable.
No existe ninguna razón estructural o de fondo para que Internet falle globalmente en el país por falta de energía: todos los datacenters donde operan los proveedores de Internet poseen sistemas de generación propia que debieran ser capaces de operar en forma autónoma por muchas horas (el ideal es que fueran varios días). La mayoría de estos centros funcionaron bien y resistieron el evento, de hecho, muy pocos servidores importantes se vieron afectados.
Finalmente, la primera noticia de mi familia, y la primera forma de comunicación que me funcionó, fue con mensajes de texto entre celulares ¡vergüenza para Internet!
No sé qué fue lo que realmente ocurrió. No hemos obtenido información oficial y nadie quiere aceptar lo que resulta obvio: Internet no respondió como esperábamos y la gran mayoría de los proveedores de Internet fallaron en proveernos un servicio confiable. La mayoría de los servidores estaban funcionando, la mayoría de los enlaces desde esos servidores a sus proveedores estaban activos y operando, pero hubo prácticamente cero tráfico durante casi 6 horas. Los amigos extranjeros no pudieron acceder a ningún sitio en Chile. La mayoría de los chilenos no teníamos acceso a nada. Esto no tiene ninguna excusa: la telefonía es esperable que no funcione, pero Internet debió haber respondido primero.
Esto es grave: si Internet hubiese estado operativo durante ese tiempo, hubiésemos sabido con prontitud sobre nuestros familiares, los medios de comunicación hubiesen tenido información para difundir en vez de tener que replicar casi un día entero de rumores, la ONEMI hubiese visto la alerta de tsunami de Estados Unidos y la Presidenta hubiese sabido a tiempo que ese mismo tsunami había destruido la base naval de Talcahuano. Mucha gente habría podido tomar decisiones importantes estando mejor informada y esto puede salvar vidas. La operación continua de Internet hoy es mucho más importante que la de la telefonía y, además, es mucho más factible de garantizar. En nuestro mundo moderno Internet es una pieza clave en la infraestructura crítica de un país pero la comunidad tiende a olvidarlo.
Es hora que nos sentemos entre los ingenieros de Internet, intercambiemos abiertamente los datos y analicemos cómo evitar que este desastre vuelva a ocurrir. Negar lo acontecido y simular que lo hicimos bien es la mejor receta para repetir este escándalo en un próximo desastre.
Fuente: Bits, Ciencia y Sociedad