Caso Crowdstrike: la necesidad de tener un inventario completo y exhaustivo

21 de julio de 2024
Crowdstrike

Seguro que el viernes os levantasteis con la noticia tecnológica del día y que seguramente siga siendo la de este domingo: "Un fallo de Microsoft tumba los sistemas de bancos, hospitales y cientos de empresas a nivel".

Más allá del titular, por una vez Microsoft no tiene mucho que ver con el fallo, al entrar en la noticia veremos que una actualización liberada por CrowdStrike ha supuesto que miles de servidores Windows de Azure AD hayan fallado y hayan dejado de prestar servicio en cientos de organizaciones.

Según la noticia, Aena ha reportado que los aeropuertos españoles están facturando las maletas manualmente y que los viajeros se encuentran con las pantallas en las que deben encontrar su puerta de embarque están en blanco. Pero no es un problema que solo haya afectado a las empresas españolas,  Bizum, VISA y bancos y aeropuertos se están viendo afectados en todo el mundo.

Está claro que el impacto de este tipo de incidencias es brutal y provocarán perdidas de millones de euros, entre la afectación a la facturación y el gasto que se tenga que realizar para revertir la situación. Además, la onda expansiva es muy difícil de calcular previamente y ponen en relevancia e importancia la capacidad de tener ambientes de pruebas y testing previos de todas las aplicaciones que dan soporte a nuestros servicios. De esta manera podemos prever y contener estos incidentes graves lo máximo posible.

Seguramente estemos de acuerdo en que no se puede prever el 100% de las cosas que pueden ocurrir, y nuestro amigo común Murphy ya se encarga de que no estemos libres de tener un "accidente" más o menos grave en cualquier momento. Por eso en estos casos es muy necesario (y casi imperativo) tener un buen sistema automático de inventario que sea completo y exhaustivo de todos los equipos existentes, virtuales o no, así como del software instalado y sus versiones.

En este caso concreto, una vez nos hemos visto afectados, el sistema de inventario nos ayudará a calcular la magnitud de la tragedia, revisando los servidores que han sido impactados y así ser conscientes de en qué equipos hay que aplicar el workaround, que dicho sea de paso debe hacerse de forma manual y de uno en uno en todos los equipos afectados.

Sin un inventario completo tendremos que llamar a Tom Cruise, porque será misión imposible solucionar totalmente el problema si no sabemos dónde tenemos que aplicarlo. En caso que por alguna razón se hayan alineado los planetas y aun teniendo CrowdStrike no nos hemos visto afectados por la actualización, el sistema de inventario nos ayudará a revisar qué equipos podrían estar potencialmente afectados y así tomar las medidas necesarias y paralizar la actualización automática hasta que haya una solución definitiva.

Estas dos medidas, que parecen muy sencillas de abordar, son casi imposibles de realizarlas con garantías en caso de no tener un inventario de hardware y software completo y confiable.

David Martínez García, Product Manager Proactivanet

Suscríbete a nuestro Blog
Loading
“La combinación perfecta entre agilidad y potencia”