Planes de continuidad: un ejemplo real
La Gestión de la Continuidad es ese proceso del que no nos acordamos hasta que es demasiado tarde. En este artículo comentaremos un ejemplo real con final feliz pero que puede ayudar a comprender la importancia de la prevención.
Espiral MS, fabricante de Proactivanet, comercializa Proactivanet como herramienta software ITSM y también ofrece otros servicios adicionales como formación, consultoría o incluso alojamiento cloud para aquellos clientes que no quieran dedicar infraestructura propia.
El entorno cloud que utilizamos es EC2 del servicio AWS ofrecido por Amazon. Funciona muy bien, ofrece muchas posibilidades y además tiene unos precios razonables. Sin embargo, nada es perfecto y todo puede fallar.
Para el pasado lunes 29 de septiembre Amazon nos advirtió de un reboot obligatorio de los entornos de computación cloud (instancias EC2) por tareas de mantenimiento. Aquí la nota de Amazon y aquí una reseña en Diario TI.
Como no era necesaria ninguna actividad por nuestra parte (el reboot era transparente), trasladamos este aviso a nuestros clientes para que supieran el corte de servicio (unos cinco minutos) y no le dimos mayor importancia.
Sin embargo, una de las instancias EC2 que realizaron el reboot no volvió a arrancar, lo que provocó que se iniciasen las acciones del plan de contingencia para restaurar ese entorno. Estas tareas fueron realizadas sin mayor complicación porque están documentadas, se han realizado en otras ocasiones (tanto en simulacros como con “fuego real”) y los entornos cloud facilitan mucho este tipo de tareas (levantar una nueva máquina, mover discos duros, etc.). Además, también hubo un poco de suerte y el entorno que falló era un entorno para pruebas y no un entorno productivo, por lo que el impacto real fue mínimo.
Pese al final feliz quiero poner este ejemplo como reflexión de la importancia que tiene ser capaz de prever posibles escenarios adversos y anticipar las acciones a emprender en estos casos.
Amazon ofrece un buen servicio, pero no hay nada infalible. Así que no se confíe y gestione la continuidad de sus servicios como parte de la continuidad de su actividad de negocio.
Por último, si todavía no está convencido de la importancia de dedicar recursos a la Gestión de la Continuidad, le ofrezco dos datos demoledores (aquí y aquí)::
- el 40% de las empresas que sufren un fallo crítico que afecta a TI cierran en menos de un año
- el 70% de las empresas que sufren una pérdida importante de datos cierran en menos de un año.
José Luis Fernández