Voilà plus de quatre ans que l’open data est porté politiquement au plus haut niveau, et de plus en plus avec la récente création du poste d’administrateur général des données. A gauche comme à droite, l’open data est loué. Quand il s’agit de rentrer dans le dur, c’est nettement plus laborieux, comme en témoigne le faible nombre de participants à la première formation continue sur le sujet monté par l’ENA en mai : six, déjà sensibilisés au sujet.
“C’est un galop d’essai”, indique Jérôme Lartigau, conseiller pédagogique à l’ENA. Nous sommes persuadés que la donnée est primordiale et nous espérons qu’il y aura d’autres sessions.”
Primordiale, mais pas au point que la prestigieuse école ouvre ses données.
Issus de services en administration centrale -Éducation nationale, Développement durable… -, les “pionniers” ont eu droit à une (re)mise à niveau sur les fondamentaux du “partage et de l’utilisation des donnée publiques numériques”, pour reprendre l’intitulé exact, qui renvoie à la gouvernance globale de la donnée. Ces cours théoriques n’ont rien de superflu, tant ce sujet brasse des problématiques complexes.
A l’#ENA formation : Partager et utiliser des données publiques #numerique #reformedeletat #opendata #Etalab http://t.co/Qf9Tb79eMT
— ENA France (@ENA_fr) April 16, 2015
Droit d’auteur, propriété intellectuelle, données personnelles…
“Qui est propriétaire de la donnée ?”, lance Lancelot Pecquet. “Celui qui produit la donnée”, avance déjà Isabelle Leleu, cheffe de service adjointe du service central d’hydrométéorologie et d’appui à la prévision des inondations (Schapi) au ministère du Développement durable. La question en amène d’autres qui conduisent sur les rives escarpées du droit d’auteur, de la propriété intellectuelle, des données personnelles.
Dans le cas des données publiques, “cela renvoie à la question des biens communs”, indique Lancelot Pecquet. En clair, une donnée publique appartient à tout le monde, à partir du moment où le cadre légal est respecté, comme la non-divulgation de données personnelles.
Un subtil équilibre entre tout le dispositif législatif encourageant l’ouverture des données depuis la loi Cada de 1978, et la loi Cnil de 1978 qui protège pour sa part des dérives liées à leur utilisation.
Autre sujet qui agite dans les chaumières administratives : celle du financement. L’occasion de revenir sur le rapport Trojette de 2013 portant sur les redevances sur les données publiques. La crainte de voir un apport d’argent disparaître, voire de causer des coûts en plus, fait partie des arguments avancés par les administrations sollicitées pour ne pas ouvrir les données.
“Il faut faire la différence entre les entités à qui on demande de trouver leurs fonds et les ministères, estime un des participants. Cela rejoint le débat sur le financement des services publics, il revient au politique de trancher ; les opérateurs, cela leur est égal, tant qu’on leur donne l’équivalent en fonds.”
A lire aussi Le rapport Trojette habille pour l’hiver les redevances sur les données publiques
Le Graal mouvant de l’anonymisation
La question du financement semble toutefois une galéjade à côté de celle de l’anonymisation des données. “D’après une étude de l’UE, il existe toujours un risque résiduel plus ou moins important de réidentification, relève Lancelot Pecquet, il peut s’avérer délicat de trouver une réponse satisfaisante.”
“C’est un gros problème pour nos enquêtes, nous avons 1400 variables, une seule suffit à réidentifier”, illustre Florence Ryk, chargée d’études et d’enquêtes au département entrées et évolutions dans la vie active (DEEVA) du centre d’études et de recherche sur les qualifications (Céreq) et correspondante informatique et libertés (CIL) de l’établissement. Nous en retirons un maximum quand nous passons les données aux chercheurs.”
Si le risque est réel, il ne faut pas pour autant verser dans des hypothèses anxiogènes et peser les avantages et les inconvénients par rapport au risque. Au passage, grince Benjamin Ooghe-Tabanou, administrateur de l’association Regards citoyens qui a assuré un session de la formation, l’État vend déjà des données personnelles, comme le fichier des cartes grises.
Un objet de communication
De façon plus globale, c’est l’intérêt même de l’ouverture des données publiques qui est interrogée. Le portail controversé de l’Enseignement supérieur et de la Recherche, qui ne fait que doublonner les données de data.gouv.fr, le portail national, a animé la discussion.
“C’est un objet de communication”, tranche Benjamin Ooghe-Tabanou. » C’est vrai que quelques jeux de données peuvent avoir un faible nombre de téléchargements, mais le plus important c’est l’utilisation qu’on en fait. Un jeu de données très peu téléchargé peut déboucher au final sur une super killer application.”, veut croire Jean-Renaud Daclin, chef de projet fonctionnel au ministère de l’Éducation nationale, de l’Enseignement supérieur et de la Recherche.
“Mais il n’y a pas besoin d’un outil de communication, répète Benjamin Ooghe-Tabanou. On est dans le second ‘effet kiss cool’ : ‘on nous avait promis d’énormes retombées !’, disent les administrations. On n’a rien promis ! L’intérêt, ce sont les externalités positives, c’est un pari. Sinon, l’open data n’intéresse pas la plupart des gens.”
“Il est vrai que l’open data est difficile à cerner et doit encore se concrétiser”, note l’un des participants. “Il est possible de modéliser la valeur ajoutée qui n’est d’ailleurs pas forcément économique”, note Lancelot Pecquet.
Récemment, la Sunlight foundation, une association américaine qui promeut davantage de transparence dans la démocratie, s’est attelée à évaluer différemment l’impact de l’open data, partant du constat que “les preuves fortes de l’impact à long terme des initiatives d’ouverture des données publiques sont incroyablement rares”.
Problèmes de formatage
La partie théorique a été complétée par un volet qui se voulait plus pratique, et qui l’a été… en théorie. Des difficultés intéressantes à affronter car elles reflètent la réalité du quotidien des administrations. Dans la vie rêvée des praticiens de l’open data, un joli fichier CSV – c’est-à-dire impeccablement formaté pour être ouvert en trois clics sur n’importe quelle machine – est mis à disposition dans un licence ouverte.
Fin praticien de l’open data, tendance pure et dure, Benjamin Ooghe-Tabanou a plus pesté sur les bugs divers rencontrés – format bizarre, navigateur obsolète, etc… – qu’il n’a montré comment utiliser un fichier. “Le problème dans vos administrations, c’est que vous n’avez pas la main sur vos machines, qui ne sont pas toujours à jour”, critique le jeune informaticien.
Didier Sarfati, responsable du bureau des systèmes d’information (BSI) du conseil général de l’environnement et du développement durable (CGEDD) propose de manipuler des données sur la qualité de service dans les transports, en l’occurrence la ponctualité. “Mon regard de citoyen, c’est qu’il n’est pas du tout pratique de cliquer sur plein de boutons pour accéder à quatre lignes de données. Il devrait y avoir sur data.gouv tout le fichier mis en ligne chaque mois, en plus de ce web service.”
“Il faut donc une personne pour s’en charger”, remarque un participant. La réaction fuse : “Chez Regards citoyens, tout est automatisé, le robot ne signale que les erreurs.” Et bonne nouvelle, data.gouv dispose maintenant d’une API (1) permetttant d’automatiser la publication sur sa plate-forme. Heureusement car “le formulaire de publication de data.gouv n’est vraiment pas drôle”, se réjouit Benjamin Ooghe-Tabanou.
Faute de pouvoir faire quelque chose avec ces données de transport, Florence Ryk propose celle du Céreq sur le parcours des jeunes après la sortie du système scolaire. Au bout de 10 minutes, le gros fichier de 21 Mo s’ouvre enfin sur des lignes illisible pour un humain : les variables sont des nombres, il faut donc ouvrir le dictionnaire des variables pour voir la correspondance.
Trop compliqué en si peu de temps, d’autant plus qu’elles sont disponibles sur un pdf, l’enfer absolu de la réutilisation puisque ce format n’est pas lisible de façon automatique par un ordinateur. La réalisation d’une “visualisation amusante” attendra encore. A la fin, on se rabattra sur… un fichier de La Gazette des communes, pas très sexy, mais formaté. Au moins Benjamin Ooghe-Tabanou peut-il montrer comment marche Raw, un des outils de visualisation de données qu’il a présentés. “Je vous rappelle que cette formation est expérimentale”, plaisante Lancelot Pecquet.
Monsieur Jourdain de l’open data
Tout comme monsieur Jourdain, les participants reconnaissent que leurs administrations font déjà de l’open data sans le savoir. Et c’est peut-être pour cette raison que cela passe, tant que ce que le mouvement implique en termes de changement de mentalités n’est pas surligné à grand renfort de communication.
“L’enjeu, c’est la conduite du changement face à l’ouverture des données, analyse Jean-Renaud Daclin. Détenir l’information c’est détenir une forme de pouvoir. Cette perte peut représenter une crainte pour les services sans compter que cela peut amener un sentiment de désappropriation et de dévalorisation de son propre travail au profit d’autres personnes. Il ne faut pas négliger également la crainte politique qui est aussi bien réelle car en rendant libre nos données nous ne maîtrisons plus sa diffusion et son interprétation par d’autres, or nous sommes là pour valoriser l’action du ministère.”
C’est aussi des stratégies d’ouverture qui sont à réfléchir, pour rassurer au mieux les parties prenantes, comme l’explique Isabelle Leleu : “Nous travaillons à la cartographie des zones inondables en temps réel. Nous pouvons impliquer les acteurs locaux, qui comprendrons mieux les données. Et nous allons d’abord la mettre à disposition des gestionnaires de crise puis du grand public, quand les données et la méthodologie seront consolidées.” Elle souligne que si les équipes sont sensibilisées à l’open data, le manque se fait surtout sentir en matière de veille sur un sujet qui évolue vite. Et de déplorer aussi dans l’ensemble “le manque de démonstration volontariste dans les ministères”, regret qui n’a rien d’isolé.
Cet article est en relation avec le dossier
Thèmes abordés
Notes
Note 01 interface de programmation, une façon normée d’interagir entre deux logiciels Retour au texte