Cómo afronté el corte de corriente de Delta Air Lines

Relato en primera persona de unos de los editores de Kaspersky Lab sobre su experiencia con el fallo del sistema de Delta Air Lines.

Fui uno de los miles de pasajeros afectados por el fallo informático de Delta Air Lines que tuvo lugar el 8 de agosto, día en el que tenía programados dos vuelos con dicha aerolínea. La verdad es que tuve suerte: la compañía no canceló ninguno de mis vuelos, no perdí el vuelo de conexión y estuve esperando menos tiempo que el promedio de los pasajeros (solo unas cinco horas).

https://media.kasperskydaily.com/wp-content/uploads/sites/87/2020/07/03044301/delta-featured.jpg

Al final, todo salió bien, aunque esas cinco horas fueron una experiencia interesante.

¿Qué sucedió?

Delta Air Lines, una de las mayores aerolíneas del mundo, opera una flota de 800 aviones que realizan 6,000 vuelos diarios en los que se transporta a más de 100 millones de pasajeros al año. La compañía tiene 13 centros aeroportuarios y uno de ellos es el de Atlanta, el mayor aeropuerto del mundo. En resumen, Delta cuenta con una buena red de centros aeroportuarios.

El 8 de agosto, a las dos y media de la mañana, hora del este, el sistema informático de servidores del centro de datos Delta Air Lines en Atlanta se apagó por un corte de corriente. Los sistemas de respaldo también fallaron o se saturaron y, como resultado, todo el sistema informático dejó de funcionar.

Según John Kraft, un representante de Georgia Power (la compañía que provee de electricidad al centro de datos), un conmutador fue el responsable del corte. Un conmutador funciona igual que un interruptor instalado en una casa (ayuda a controlar y a intercambiar el flujo de energía).

Robert Mann, analista del sector y ex-ejecutivo de la aerolínea, dijo a Reuters que “seguramente la compañía estaba llevando a cabo una prueba rutinaria del sistema eléctrico de reserva cuando el conmutador falló y dejó a Delta sin sus generadores de reserva”.

Como resultado, el 8 de agosto se cancelaron unos 1,000 vuelos y en los días posteriores, mientras Delta intentaba recuperarse, se cancelaron más. La gran mayoría de vuelos sufrieron retrasos.

Aparte del impacto en los pasajeros, el incidente afectó a docenas de aeropuertos e incrementó la carga de trabajo de los oficiales de operaciones de vuelo en todo el mundo.

Por supuesto, el sistema de los vuelos con conexión entre Delta Air Lines y sus socios también se vio afectado. Muchos pasajeros tuvieron que hacer noche en ciudades en las que esperaban hacer una corta escala.

Delta ofreció a los pasajeros afectados la opción de abandonar de forma voluntaria el vuelo que tenían planeado y de quedarse en la ciudad de partida durante un día con los costos a cargo de la compañía, solución que muchos aceptaron. Delta también prometió cupones por valor de 200 dólares a los pasajeros cuyos vuelos se cancelaron o retrasaron más de tres horas.

Cómo pasé el día

La tarde del 8 de agosto fue la peor parte del día. Fue el momento con más fallos, cancelaciones de vuelos y retrasos. Pasé ese tiempo en el Aeropuerto Internacional de Los Ángeles, el quinto aeropuerto del mundo con mayor tráfico de pasajeros (da servicio a unos 70 millones de pasajeros anualmente), por lo que no se trata de un lugar tranquilo incluso cuando todo funciona con normalidad.

Sucedían cosas extrañas por todas partes. Mi vuelo a Seattle desapareció de la pantalla de salidas y llegadas y la aplicación móvil de Delta era el único modo de averiguar cuándo y dónde empezaban los embarques.

Aun así, la puerta asignada cambiaba cada cinco minutos. Supuse que los encargados de la asignación de las puertas debían estar distribuyendo cientos de vuelos en las docenas de puertas (como el juego del Tetris, pero al nivel de dificultad más alto).

Después de media hora corriendo por la terminal, al final llegué a la puerta que de verdad habían asignado para mi vuelo. La asignación de esa puerta se hizo de formal verbal: los empleados de la aerolínea se mantenían constantemente en contacto mediante teléfonos antiguos.

Pasaron dos horas más hasta que embarqué y luego otras dos horas hasta que el avión despegó.

Durante las cinco horas de retraso, no podía dejar de apreciar la profesionalidad con la que se comportaban los empleados de la aerolínea. Lo hicieron lo mejor posible para mitigar las consecuencias del corte. Con gran paciencia, explicaron a los pasajeros lo que sucedía y pidieron disculpas por los inconvenientes, siempre de forma educada, amigable y con calma. Ningún empleado fue descortés ni ignoró las preguntas, a pesar de que tenían mucho trabajo por hacer.

https://twitter.com/ParachuteTent/status/758979833107927040

Conclusiones

Cuando un sistema informático falla, debemos utilizar métodos antiguos que no solo parecen muy ineficientes, sino que son difíciles de utilizar hoy en día porque no se diseñaron para soportar las cargas de trabajo actuales. Lo único que podemos hacer en estos casos es esperar que los sistemas electrónicos se restablezcan lo antes posible.

¿Qué se puede hacer? ¿Debemos dejar de usar los sistemas electrónicos porque en algunas ocasiones no son de fiar? Claro que no. Ninguna compañía puede competir sin las tecnologías modernas. Los coches y los camiones son peligrosos, pero nadie sugiere cambiarlos por caballos para transportar bienes y personas.

Lo que sí necesitamos es prestar la máxima atención a la seguridad y a la fiabilidad. Los dispositivos electrónicos en los que confiamos para gestionar el trabajo de infraestructura crítica debería estar protegidos contra incidentes y ataques. Lo sucedido es un recordatorio de las molestias que un fallo grave en sistemas industriales puede ocasionar a cientos de miles de personas, sin mencionar las pérdidas financieras.

Consejos