bruno-mangematin

Arnaud Mangematin

Directeur, services-conseils, gestion des risques

L’incident du 19 juillet 2024 a paralysé une partie de l’économie à l’échelle internationale. Durant de longues heures, plusieurs secteurs ont été incapables d’opérer ni de remédier à la panne, mettant en évidence l’interdépendance des systèmes numériques, et les risques liés aux tiers. Cette perturbation considérée comme un Cygne noir (Black Swan) – événement imprévisible entraînant des conséquences majeures, mais, rétrospectivement, semble avoir été inévitable – a souligné l'importance cruciale pour toutes les entreprises de renforcer leur plan de continuité des activités contre les perturbations informatiques futures. L’incident a provoqué la formulation de plusieurs hypothèses – certains croyaient que l’incident était une attaque de cybersécurité visant la disponibilité des systèmes. Toutefois, cette hypothèse a rapidement été démentie à la suite de l’affirmation du fournisseur de service citant qu’une mise à jour au niveau de leur logiciel de sécurité a causé l’empêchement de redémarrage des ordinateurs, affichant l’écran bleu de la mort (Blue Screen of Death) dans les systèmes Windows de Microsoft. Nous nous pencherons dans cet article sur les impacts de l'incident et soulignons les stratégies clés pour une résilience organisationnelle robuste et durable.

Impact immédiat

Cette perturbation a touché 8,5 millions de machines Windows dans le monde et a causé une perte financière de plus de 5,4 G$ US aux États-Unis seulement. Différents secteurs ont été touchés, dont la finance, les soins de santé, les marchés boursiers, les transports, l’éducation, les entreprises privées et plusieurs entités gouvernementales. Les équipes TI ont été mobilisées, car un dépannage automatique ou un retour en arrière n’étaient pas possible. Une solution de contournement manuelle était nécessaire directement sur les ordinateurs des utilisateurs.

Impacts sur quelques jours :

  • Arrêt des opérations, plaintes des clients et surcharge des centres d’appels et service à la clientèle
  • Longues files d’attente avant d’avoir accès au support informatique sur place
  • Déclenchement des solutions de continuité des activités et des contournements manuels
  • Surcharge anormale des ressources des équipes informatiques, longues heures de travail, fatigue et stress

Importance de la continuité des activités

Les parcs informatiques de plus en plus complexes et les attaques de cybersécurité de plus en plus sophistiquées nécessitent une proactivité au sein des organisations au niveau de la résilience organisationnelle, en cas d’événement majeur ou de crise. La préparation à la gestion de crise, à la continuité des activités et à la reprise informatique permet de :

  • Minimiser les pertes et les dommages subis à l’organisation et à ses employés en cas de crise
  • Éviter les problèmes juridiques dont le non-respect peut entraîner des amendes et des poursuites
  • Assurer d’atteindre l’objectif minimal de continuité des activités (OMCA) protégeant ainsi la réputation et la notoriété

En nous basant sur les meilleures pratiques des différentes industries et sur des normes internationales telles que l'ISO 22301, voici les étapes que nous recommandons pour que vous puissiez développer plus de résilience et mieux vous préparer à gérer diverses perturbations :

  1. Comprendre les besoins de continuité de l’organisation : S’approprier la cartographie des processus et des activités, réaliser une analyse des risques et une analyse d’impact sur les activités (BIA). Évaluer des durées d’interruption maximales admissibles (DIMA) et des définir des objectifs de reprise d’activité (RTO).
  2. Définir les stratégies de continuité : Comparer des options pour définir les solutions de continuité les plus adaptées. Établir la politique de continuité des affaires de l’organisation.
  3. Déployer les solutions de continuité : Définir et rédiger les plans de réponse aux incidents, de gestion de crises, de continuité des activités et de reprise informatique détaillés (systèmes redondants, capacité de bascule et capacité de retour en arrière), scripts adaptables et canaux de communication clairs.
  4. Tester et entraîner : Organiser des campagnes de sensibilisation, des formations et des exercices auprès des employé.e.s.
  5. Maintenir et améliorer le dispositif de continuité : Gérer le SMCA (système de management de la continuité d’activité), gérer l’amélioration continue et les revues périodiques.
  6. Fournisseurs et tiers : Évaluer minutieusement les capacités de gestion de crises, de continuité des activités et de la sécurité informatique des systèmes des partenaires essentiels.

Il est essentiel de se préparer adéquatement pour minimiser les interruptions et maintenir un service de qualité pour ses clients. Cette préparation contribue également à construire une société plus durable et résiliente, capable de faire face aux crises de plus en plus fréquentes. En adoptant ces mesures, vous participez non seulement à la stabilité de votre organisation, mais aussi à la création d’un environnement global plus robuste.

Arnaud Mangematin, Directeur services conseils
Gaby Abou-Haidar, Conseiller en résilience
Serge El-Hage, Conseiller en sécurité

À propos de l’auteur

bruno-mangematin

Arnaud Mangematin

Directeur, services-conseils, gestion des risques

Fort de plus de 10 ans d'expérience en gouvernance, risque et conformité (GRC), en résilience et en sécurité des systèmes d'information, Arnaud est directeur services-conseils chez CGI. Passionné par le support aux clients, il met ...