A quoi peut servir l’intelligence artificielle (IA) dans les services d’archives ? C’est à cette question que tentent de répondre plusieurs auteurs dans un dossier du premier numéro 2024 de la revue Archivistes, éditée par l’AAF.
Gain de temps sur les vracs archivistiques
Parmi les questions abordées, la gestion des « vracs » archivistiques (documents accumulés de façon désordonnée, sans classement ni identification) par l’IA semble prometteuse pour ce qui est du temps gagné.
Cependant les auteurs attirent l’attention sur le manque de maturité de ces pratiques et les risques en termes de protection des données.
Génération de données inédites
De son côté, l’INA présente son expérience d’automatisation de la transcription des archives audiovisuelles, qui remonte à 2020. « Concrètement, l’expression de besoin prenait ici pour modèle ce qu’un traitement manuel aurait produit… s’il avait été matériellement possible de générer une segmentation fondée sur le visionnage quasi continu de la diffusion, 24 heures sur 24 », expliquent les auteurs.
L’IA s’est avéré un outil générateur de « données inédites » (transcription, détection d’entités nommées ou encore reconnaissance de visages). Avec à la clef le projet data.ina.fr, visant « à générer des indicateurs d’objectivation du propos médiatique, en répondant à des questions telles que « de quoi parle-t- on à la télévision et à la radio ? », « quelles sont les personnes les plus présentes ? »
Et l’auteur de s’interroger sur ce que l’IA induit comme sens nouveau donné à la « métadonnée » : objectivation d’un contexte et d’une nature de production, ou simple restitution de la teneur et du contenu du document ? »
L’IA un nouveau mirage trompeur ?
Les auteurs relatent aussi une procédure d’archivage des dossiers numériques de recours devant la Cour nationale du droit d’asile (CNDA). Au-delà des considérations techniques, les auteurs retiennent de cette expérience que « l’écueil majeur serait de faire de l’IA, dans le discours sur l’archivage numérique, un nouveau mirage trompeur ou stérilisant, à l’image du mythe de l’automatisation.[…]. L’IA doit demeurer une potentialité à mobiliser en fonction des entrants, besoins, objectifs, et ressources disponibles. »
Et de pronostiquer deux usages dominants. D’abord « le traitement de données d’une quantité trop grande pour être appréhendables par une équipe projet, et de métadonnées d’une qualité trop faible pour suffire aux fins archivistiques de la collecte, de la gestion et de l’accès. » Ensuite, le traitement de « fonds numériques ou numérisés dont la logique originelle a été perdue mais peut être restaurée. »
Somme de défis à relever
Le dossier rend également compte d’une double expérience menée aux Archives fédérales suisses, pour analyser des images fixes et animées, pour procéder à la reconnaissance textuelle, avec deux outils différents (Transkribus et Lexipanion). Les auteurs pointent quelques défis à relever : garantie de la confidentialité des données, gestion des failles technologiques et de la courbe d’apprentissage des nouveaux outils numériques…
Références
- Archives et intelligence artificielle
- Restez informé de l'actualité des politiques culturelles, inscrivez-vous à la Newsletter Culture de la Gazette