La transformation digitale de l’Etat accélère l’accroissement du volume de ressources numériques
Le développement des technologies de l'information et de la communication a profondément modifié les méthodes de travail en facilitant et en accélérant considérablement la production, le partage et le stockage d'informations numériques. En parallèle, la reconnaissance de l’écrit électronique comme preuve a ouvert la voie à la dématérialisation des processus métier et à la production d'originaux numériques toujours plus nombreux. Enfin, la transformation digitale de l’état, et la dématérialisation de 100% des démarches administratives, comptant parmi les objectifs phares du Programme d’Action Publique 2022, contribue à accroitre le volume de ressources numériques pour lesquelles, les administrations et les entreprises sont soumises à la même obligation de conservation des documents électroniques que pour les documents papiers avec les risques juridiques et de continuité de l’activité en cas de perte.
Dans ce cadre, la DINSIC (DSI de l’ETAT), instrument de l’amélioration de la capacité numérique de l’Etat, a lancé en 2015 le programme VITAM, visant à proposer aux institutions publiques, une solution logicielle innovante d’archivage électronique, mutualisée, orientée Big Data et open source, permettant la prise en charge, la conservation et la consultation sécurisée de très gros volumes d’archives numériques. Trois ministères, le Ministère de l’Europe et des affaires étrangères, le Ministère de la Culture et le Ministère des Armées, responsables de la conservation des archives de l’État, se sont associés dans le cadre d’une stratégie interministérielle pour répondre ensemble à cet enjeu d’archivage numérique dans la durée.
L’archivage, pierre angulaire de la transmission des patrimoines
Les organismes publics et les services de l’état sont depuis quelques années observés sous l’angle de la création de valeur. A ce titre, ils doivent améliorer leur offre de service et éclairer les décisions politiques tout en réduisant leurs budgets. Un des leviers d’action consiste dans la valorisation de leurs données. La nomination fin 2014 d’un Administrateur Général des Données rattaché au Secrétaire Général pour la Modernisation de l’Action Publique et la reconnaissance par ses services de la donnée comme un « actif stratégique » en témoignent. Or, la valorisation des données est seulement possible s’il y a préservation (et donc archivage) de celles-ci.
Dans le domaine de la Culture notamment, la conservation des archives en France est organisée « dans l’intérêt public, tant pour les besoins et la justification des droits (…) que pour la documentation historique de la recherche ». Le Service Interministériel des Archives de France est chargé de proposer au ministre de la Culture les choix stratégiques à opérer en matière d’archives patrimoniales et de les mettre en œuvre. Parmi les organismes chargés de la conservation de ces documents, on compte 2 institutions majeures : les Archives Nationales et la Bibliothèque Nationale de France.
Les Archives Nationales conservent et communiquent les archives des administrations centrales de l'État (hors Ministères de la Défense et des Affaires étrangères), les minutes des notaires de Paris et des fonds privés d'intérêt national. Engagées dans une politique ambitieuse de modernisation et de dématérialisation croissante des supports d’archivage, les Archives Nationales ont lancé en 2009 un projet de construction d’un nouveau centre à Pierrefitte pouvant accueillir 320 kilomètres linéaires de rayonnage en même temps qu’un projet de refonte de son SI d’Archivage, projet confié à CGI. Ce système couvre aujourd’hui l’ensemble de l’activité des Archives : collecte des archives, gestion logistique, communication, mise en valeur des instruments de recherche dans une salle des inventaires virtuelle. En outre, résolument tournées vers le numérique, les Archives Nationales conservent aujourd’hui près de 200 millions de fichiers nativement numériques, soit 45 To de données.
Pour répondre à l'évolution numérique actuelle, les Archives Nationales ont entamé leur mutation interne. Leur action s'inscrit dans le cadre du programme interministériel VITAM présenté plus haut, qui conduit l'État à proposer un socle d'archivage électronique commun à toute l'Administration.
CGI a ainsi remporté courant 2017, la mise en œuvre du projet ADAMANT (Administration des Archives et de leurs Métadonnées aux Archives Nationales dans le Temps), premier projet de déploiement de la solution VITAM au cœur de la stratégie numérique des Archives Nationales.
La Bibliothèque Nationale de France (BnF) a pour principale mission de collecter, conserver, enrichir et communiquer le patrimoine documentaire national. Sa mission de collecte et de conservation doit permettre de couvrir tout type de support, qu’il s’agisse de livres, périodiques, documents cartographiques, documents iconographiques, documents sonores et multimédias, logiciels, vidéogrammes mais également la musique et les sites web.
Dans le cadre de sa mission de conservation du patrimoine français, la BnF a donc entrepris depuis 1990 un vaste chantier de numérisation de ses collections et compte aujourd’hui plus de 7 millions de documents numérisés, visibles dans Gallica (http://gallica.bnf.fr), l’une des plus importantes bibliothèques numériques accessibles gratuitement sur Internet.
La conservation des données numériques par la BnF pose donc de façon cruciale la question de la pérennisation. Sommes-nous certains que, dans dix ans, les documents produits seront encore consultables et que les efforts consentis à leur création ne seront pas définitivement perdus? L’archivage à long terme ne se résume donc pas seulement au stockage mais nécessite la mise en place d’un dispositif plus complexe, capable de réaliser des opérations spécifiques, comme la migration de formats et de supports, qui assurent la lisibilité des documents à très long terme.
Le système d’archivage SPAR (Système de Préservation et d'Archivage Réparti) permet à la BnF de réaliser de telles opérations, sur un ensemble important de documents de tous types : y sont conservés 7 millions de documents numérisés (textes, images, musiques, vidéos), 16 milliards de pages web (issues du dépôt légal), représentant 3Po (3 000 To) de données à ce jour.
Le volume de documents nativement numériques ou numérisés dans le cadre de la transformation digitale des entreprises d’une part et de l’Etat d’autre part font donc désormais entrer les projets d’archivage dans l’ère du Big Data.