Les modèles d’IA générative et d’analyse prédictive de CGI réduisent le temps d’identification des documents de plusieurs mois à quelques minutes et simplifient rapidement les analyses à grande échelle pour une grande entreprise pétrolière et gazière.
Introduction
Lorsque notre client du secteur pétrolier et gazier a reconnu la nécessité d’améliorer sa stratégie de gestion des documents pour rehausser la qualité des renseignements, accélérer les processus et assurer la conformité réglementaire, nous lui avons offert des services de conseil d’experts par l’entremise de notre solution de PI CGI GovernWise360. En travaillant en étroite collaboration avec leurs équipes et en comprenant leurs défis particuliers, nous avons combiné l’intelligence artificielle générative à des modèles prédictifs adaptés à des domaines d’ingénierie précis (p. ex. génie civil, électrique et des procédés). Cela a permis à leurs équipes de déterminer efficacement quels fichiers devaient être conservés, et de traiter et d’analyser les documents existants à grande échelle tout en veillant à ce que la solution s’intègre harmonieusement à leurs flux de travail actuel.
"Le projet pilote "Intelligent Records Radar" de CGI a transformé la gestion des documents en permettant une classification rapide et évolutive dans tous les domaines de l'ingénierie avec des modèles validés par des experts, ce qui a permis de dégager des informations essentielles et de renforcer la gestion des actifs dans l'ensemble de l'organisation."
Expert senior en TI
Défis
L’une des plus importantes entreprises pétrolières et gazières au monde a connu une croissance fulgurante de son contenu numérique, ce qui a entraîné de la confusion, un ralentissement des activités et une baisse de productivité au sein de diverses équipes. La politique d’élimination des documents non essentiels qu’elle a mise en œuvre visait à simplifier la conservation du contenu en ne gardant que les renseignements les plus pertinents. Cette politique a toutefois créé un risque élevé de perte de données importantes si elles étaient mal classées. Le processus d’analyse manuelle s’est révélé accablant pour les utilisateurs et sujet à des erreurs, tandis que leurs outils logiciels existants n’avaient pas la capacité de traiter de grands ensembles de données ou de fournir des prédictions avec le niveau de compréhension nuancée requis pour prendre décisions cruciales.
L’approche axée sur le client de CGI a été essentielle pour surmonter ces défis. Nous avons collaboré étroitement avec les équipes d’ingénierie du client pour nous assurer que la solution fondée sur l’IA que nous avons mise au point répondait à leurs besoins particuliers en matière d’exactitude et de convivialité. L’élaboration de modèles pour traiter les domaines techniques était complexe. Chaque modèle a nécessité l’apport d’experts en ingénierie, de mots-clés validés et de documents propres au domaine. De plus, le volume considérable de documents, soit plus de 900 millions, représentait un défi important en matière de classification et de conservation en vrac.
Solution
L’approche consistait à analyser les fichiers dans SharePoint et MS Teams pour identifier ceux qui devraient être déclarés comme documents officiels. Cette démarche a permis aux équipes d’identifier plus facilement les documents et d’analyser plus rapidement ceux-ci à grande échelle. Grâce au soutien de CGI, le projet pilote « Intelligent Records Radar » a été lancé, adapté aux besoins des équipes de génie civil, électrique et des procédés.
Nous avons accordé la priorité à l’expérience utilisateur en harmonisant les modèles fondés sur l’intelligence artificielle avec les flux de travaux de l’équipe, en automatisant des tâches comme l’identification, la conservation, l’élimination et la classification sécuritaire des documents. Adapté à des domaines d’ingénierie précis (p. ex., COP, ICE, mécanique, procédés), le système a permis d’identifier rapidement et précisément les documents essentiels afin de prendre des décisions éclairées.
Voici quelques fonctionnalités de la solution.
- Intégration de données –
Des tâches régulières ont été établies pour extraire et intégrer des documents pertinents de SharePoint, qui ont ensuite été traités à l’aide de techniques avancées de TLN comme la synthèse de texte, la lemmatisation et la classification de texte. Les données épurées ont été stockées dans une base de données pour faciliter l’accès et l’utilisation dans les modules d’apprentissage machine.- Traitement avec divers modèles –
La solution intègre plusieurs modèles de traitement, y compris le traitement par lots, la diffusion en continu et en temps réel ainsi que l’analyse basée sur l’apprentissage machine, afin d’accroître la souplesse et l’efficacité. Le traitement par lots optimise les performances en traitant de grands volumes de données à intervalles définis, tandis que la diffusion en continu et en temps réel permet un traitement instantané pour les applications pour lesquelles la rapidité est essentielle. Les modèles d’apprentissage machine fournissent des perspectives pratiques et des analyses prédictives, ce qui permet au système de s’adapter à l’évolution des demandes et de répondre à divers besoins de traitement.- Récupération de données –
À la réception d’une requête, le système a utilisé des modèles comme la régression logistique, la classification naïve bayésienne et le réseau neuronal artificiel pour identifier le contenu connexe en fonction de vecteurs intégrés. Il a prédit si un fichier était un document à conserver et a fourni des valeurs de probabilité. Le modèle proposait également une étiquette de conservation et une durée en utilisant l’information du document et les valeurs de similitude word2vec de gensim et de similarité cosinus. De plus, des mots-clés propres à chaque service ont été utilisés pour prédire les mots-clés associés à chaque document.- Adoption et renforcement de la confiance –
La synthèse du contenu et les nuages de mots générés par l’IA ont considérablement optimisé le modèle et renforcé la confiance de l’équipe. Une interface Web intégrée a été développée pour visualiser les prédictions, ce qui permet aux utilisateurs d’examiner les résumés de documents et les nuages de mots générés par le modèle d’IA générative. Cette interface a permis aux utilisateurs de valider et de corriger les prédictions, créant ainsi une boucle de rétroaction qui a continuellement amélioré la précision et la fiabilité du modèle. Ce processus a non seulement favorisé la confiance, mais il a aussi amélioré la performance du modèle grâce à un raffinement itératif.- Production et visualisation de rapports –
Power BI transforme les données prédites et les cotes de probabilité en renseignements exploitables au moyen de rapports et de tableaux de bord interactifs. Le tableau de bord comprend des renseignements sur les fichiers classés comme des documents à conserver ou non, les étiquettes de conservation et les durées probables pour chaque fichier, les valeurs de probabilité par service affichant les cotes les plus élevées dans les tableaux et le nombre de mots-clés les plus pertinents pour chaque service.
Résultat
CGI s’est associée au client pour tirer parti de son investissement dans Microsoft 365 et de l’expertise de CGI GovernWise360, en développant des modèles d’intelligence artificielle et d’apprentissage machine qui simplifient la gestion des documents, réduisant ainsi la classification et le temps de conservation du contenu de plusieurs mois à quelques heures. Le projet pilote a analysé les répertoires du client, ce qui a permis d’identifier rapidement et précisément les documents tout en répondant à des besoins clés comme la suppression automatisée, la conservation à long terme et la détection des doublons. Cette solution axée sur l’utilisateur a permis d’améliorer la conformité, de mettre en place des mesures de sécurité strictes, de réduire au minimum les erreurs, d’accroître l’efficacité et d’obtenir de nombreux éloges de la part de la direction du client pour sa rapidité, sa précision et ses gains de productivité.
CGI GovernWise360 s’améliore grâce aux activités de nos clients
CGI prévoit étendre la gestion de l’information fondée sur l’intelligence artificielle dans un plus grand nombre de secteurs d’activité et de disciplines, ce qui améliorera l’évolutivité et l’adaptabilité de CGI GovernWise360. En peaufinant les modèles d’IA et en intégrant l’apprentissage machine avancé, CGI vise à offrir des solutions plus précises, plus intelligentes et adaptées aux besoins de l’industrie. Cette transformation plus vaste repoussera les limites de la gestion des documents fondée sur l’IA en mettant l’accent sur une automatisation plus poussée, une meilleure prise de décisions et une intégration accrue pour accroître l’efficacité, l’exactitude et la conformité entre les secteurs.