Hoy miércoles se cuentan ya 3 días de problemas con el servicio BlackBerry, problemas que se extienden por 4 continentes y han dejado a los usuarios (incluyendo al que escribe) con un terminal que únicamente puede realizar y recibir llamadas o enviar y recibir SMS puesto que cualquier otro tipo de tráfico (mensajería instantánea, aplicaciones, correo electrónico o navegación web) no puede ser cursado. ¿Y cómo puede fallar un servicio que ha calado tan hondo en el mundo empresarial? La verdad es que era una pregunta que muchos usuarios del servicio nos estábamos haciendo y los operadores, como prestadores del servicio a los clientes, no sabían qué decir y siempre remitían a una RIM que, al fin, ha dado una tímida explicación de lo sucedido.

Es interesante tener presente que todas las comunicaciones que llegan a los dispositivos BlackBerry provienen de los servidores de RIM que están emplazados en Canadá, Estados Unidos y Reino Unido y que conforman el núcleo del servicio en el que se controlan las comunicaciones, se cifran y que hacen que el servicio BlackBerry sea lo que es y haya calado tanto entre los usuarios. Aunque técnicamente la centralización (en estos 3 puntos) es la base del servicio, en caso de fallo, deja atados de pies y manos a los usuarios que tienen centralizadas todas sus comunicaciones, incluso algo tan simple como la navegación por Internet.

Según la explicación de RIM, cuando falló uno de sus servidores centrales, uno de los switches del núcleo de su red, que teóricamente estaban configurados para trabajar en alta disponibilidad y debía redirigir el tráfico al resto de la infraestructura en caso de fallo, no realizó tal función y, por tanto, los usuarios se quedaron sin servicio. Cuando RIM intentó solventar el problema, el tráfico acumulado pendiente de cursar era de tal magnitud que, al aplicar el balanceo sobre el resto de servidores, éstos se colapsaron y llegaron a un punto de congestión que se extendió más allá del territorio EMEA (que fue el que sufrió el fallo el primer día).

Los retrasos en la navegación y mensajería que han experimentado los usaurios de BlackBerry en Europa, Oriente Medio, África, India, Brasil, Chile y Argentina han sido provocados por un fallo en un switch del núcleo de la infraestructura de RIM. Aunque el diseño del sistema estaba preparado ante fallos, el failover no funcionó tal y como se esperaba. Como resultado, una gran cola de datos se generó y estamos trabajando para restaurar el servicio lo antes posible

Dejando a un lado la inconveniencia de la indisponibilidad del servicio, esta caída de BlackBerry pone en relieve dos aspectos muy importantes. Por un lado, la alta dependencia de estos terminales con los servidores del fabricante son algo preocupantes, me parece excesivo que la mensajería instantánea o la navegación web también dependan de RIM pero, realmente, lo más preocupante es el dimensionamiento del servicio que parece haberse quedado algo corto e incapaz de asumir el tráfico total cuando una de los soportes se cae. ¿Cómo es posible que dos tercios de la infraestructura no sean capaces de asumir el tráfico total aunque sea con pequeños retrasos? Quizás la demanda del servicio esté muy por encima de la infraestructura real, algo que es muy preocupante.

Recibe cada mañana nuestra newsletter. Una guía para entender lo que importa en relación con la tecnología, la ciencia y la cultura digital.

Procesando...
¡Listo! Ya estás suscrito

También en Hipertextual: