En poursuivant votre navigation sur ce site, vous acceptez l'utilisation de cookies pour vous proposer des services et offres adaptés à vos centres d'intérêt. OK En savoir plus X
Déposez votre CV Fournisseurs du secteur public

Logo Gazette.fr

 

Réagir

Opendata

Données publiques : l’échelle des priorités

Publié le • Par • dans : A la une, Dossiers d'actualité, France

0

Commentaire

Réagir

opendata © Maksim Kabakou - Fotolia.com

Registres clés, données pivots, données d’intérêt général..., ces différents concepts se recoupent plus ou moins. Un point commun : ces data sont considérées comme très importantes, car constituent la base de l'écosystème autour des données publiques.

Voir le sommaire

Cet article fait partie du dossier

Réutilisation des données publiques : des promesses vertigineuses

 

On promet monts et merveille des données, et des données publiques en particulier, mais il suffit d’avoir manipulé quelques jeux pour comprendre que toutes ne se valent pas : certaines revêtent une importance particulièrement importante. Plusieurs termes les désignent, qui se recoupent plus ou moins : registres clés, données de référence, données pivots et données d’intérêt général sont les plus courants.

Toutes n’ont pas vocation à finir en open data, car leur ouverture contreviendrait à la législation sur la protection de la vie privée. En revanche, leur constitution, leur entretien, leur circulation et leur utilisation optimales sont au coeur des enjeux.

Les registres clés ou “key register” : vieux comme le cadastre napoléonien

“Les registres clés, ou key register sont des jeux de données fondamentaux pour le fonctionnement de la société. On parle aussi de basic data, indique Pierre Chrzanowski, consultant indépendant, membre du réseau d’expert open data de la Banque Mondiale. Ce sont des données transversales, de qualité, connectée et réutilisées.”

“On écrit une fois une base de données qui a vocation à être unique mais sert à beaucoup ; elle génère de fortes externalités, détaille encore Simon Chignard, expert open data et auteur de deux ouvrages sur le sujet. Ce modèle s’inspire du cadastre de Napoléon(1).” Concrètement, il s’agit par exemple du cadastre, du registre des entreprises et des individus, de la base adresse, des cartes topographiques, etc.

Pierre Chrzanowski  souligne que les Pays-Bas et le Danemark sont en avance sur ce sujet. Le déploiement de tels registres s’est fait “à partir de la demande de l’Etat”, et leur gouvernance, un gros enjeu, s’appuie sur “un modèle économique, public, le choix le plus efficace”, estime-t-il. L’ouverture des données s’est faite dans un second temps.

En revanche, déplore-t-il, “il n’y a pas de gouvernance globale en France. Cela fait partie du travail de l’administrateur général des données (2) de la mettre en place. Les blocages de certaines administrations, comme Bercy et l’Insee, qui refusent d’ouvrir les deux registres clés pas encore en open data, la base SIRENE des entreprises, et le cadastre, mettent en relief les jeux de pouvoir.”

Les données de référence : la patte de la Disic

La Direction interministérielle des systèmes d’information et de communication (DISIC) a recours au concept de données de référence, dans le cadre de sa démarche d’urbanisation du système d’information de l’Etat : “la gouvernance des données est l’un des objectifs majeurs de la démarche d’urbanisation”. Sa mise en place consiste en premier lieu à considérer les données manipulées par l’État comme un actif stratégique, et à ce titre assurer leur gestion comme telle : recensement, responsabilité, standardisation, faciliter l’accès, la diffusion, la réutilisation, le partage et l’archivage sécurisé pour en maximiser la valeur.

Quelle différence avec les registres-clés ? “Dans les deux cas, on retrouve la notion de centralité pour le fonctionnement de l’Etat et de l’économie”, poursuit Simon Chignard. Mais les registres-clés mettent l’accent sur le mode de production.” Il n’y a donc pas là forcément la notion de base de données unique.

Les données pivots : l’approche des acteurs de l’économie de la donnée

Si vous regardez une colonne de données pivots, vous n’apprendrez rien : des caractères défileront, dépourvus de sens. Et pour cause, la donnée pivot est un identifiant unique qui sert à relier des bases de données. C’est sa valeur, énorme, car la plus-value des données vient souvent de leur croisement avec d’autres.

Cette notion est issue du travail du Groupement français de l’industrie de l’information (3), des professionnels de la données qui sont confrontés dans leur travail quotidien à la question de l’interconnection. Le champ de ces données pivots recouvrent la géographie (ERP, Iris…), la santé (Sniiram, Ameli), les entreprises (Siret, RNA…), juridiques (jugements des TGI, des prud’hommes…) et les collectivités locales (marchés publics, Helios…).

Des données clés ou de référence peuvent – voire doivent dans certains cas – avoir un identifiant unique pour répondre à leurs objectifs. Parmi les exemples de registres clés ou de référence, une partie se retrouve dans la liste du GFII. “Nous partageons, 50 à 60% de la définition, résume Denis Berthault, responsable du groupe données publiques au GFII. Il y a d’une part le point de vue politique au sens large du terme, et administratif, et le point de vue économico-technologique, celui du ‘linked open data’.”

Il chiffre l’investissement à “des millions, voire des dizaines de millions d’euros”, qui pourrait en partie être pris en charge par le programme investissement d’avenir, dont un des volets est très porté sur la donnée.

Les données minimales : la contribution d’Open Data France

Dans le cadre du projet de loi Notre, qui prévoit d’ouvrir les données pour les collectivités de plus de 3500 habitants, l’association Open Data France, qui réunit des collectivités lancées dans une démarche d’open data, a listé les données “les plus pertinentes du point de vue de la transparence et de la réutilisation”. Elles sont évaluées en fonction de leur difficulté d’ouverture. Parmi celles-ci : le PLU, le budget, l’état civil, les marchés publics…

Toutefois, “beaucoup de données intéressantes ne sont pas produites par la collectivité, mais par un ensemble d’acteurs publics et privés, avec des enjeux différents, note Jean-Marie Bourgogne, chef de projet pour Montpellier Territoire Numérique et membre d’ODF”, citant l’exemple des agences d’urbanisme. Il souligne l’importance de faire rentrer dans la loi “une clause open data pour les marchés publics”, ce que certaines collectivités comme Paris ont fait.

Les données d’intérêt général : bon courage Axelle Lemaire

Les données d’intérêt général (DIG) sont un cas distinct des notions précédentes. Simon Chignard l’avait déjà évoqué en 2012 dans un billet sur “un open data des biens communs”.

Cette approche est reprise depuis quelques mois par Axelle Lemaire, la secrétaire d’Etat en charge du Numérique. Il recouvre des données au-delà du champ public mais qui « concernent des activités d’intérêt général » ou « présentent des externalités fortes », comme les données de transport. L’idée serait d’introduire un nouveau statut juridique dans la future loi sur le numérique pour contraindre des sociétés privées ou parapubliques à les ouvrir.

Le rapport Jutand sur les données de transport invitait à le mettre en oeuvre. Mais les atermoiements à l’ouverture des données de transport dans le cadre de l’examen de la loi Notre témoignent du défi.

Dans son récent rapport préparatoire à la loi sur le numérique, le Conseil national du numérique s’est montré plus que réservé sur le sujet, soulignant le flou de la notion. Sollicité, le cabinet d’Axelle Lemaire n’a pas donné suite.

Jouant sur les mots, Thierry Mandon, le secrétaire d’Etat en charge de la Réforme de l’Etat et de la Simplification (l’échange a eu lieu avant son remplacement en juin par Clotilde Valter, ndlr) nous a indiqué : “Nous espérons que la société civile va utiliser de plus en plus les données que nous mettons à disposition, dans une vraie démarche de coopération entre puissance publique et usagers, qu’ils soient des citoyens, des entreprises, des associations… Voilà une première façon de faire des données véritablement d’intérêt général, au sens où elles servent au plus grand nombre. Dans le même temps, il est normal qu’Axelle Lemaire s’intéresse à d’autres dimensions de la mobilisation d’autres données, car on en devine le potentiel, tant que le cadre de cette ouverture est clair pour tous.”

Plutôt que la contrainte, il parie en priorité sur la diplomatie pour ouvrir ses données : “Il faut regarder au cas par cas, encourager le partage volontaire de données, voire l’imposer dans des secteurs spécifiques. Mais toujours avec des garanties juridiques solides, pour structurer le champ de la donnée, qui en a besoin. C’est un sujet difficile où se mêlent de nombreux impératifs à respecter : libre concurrence, respect de la vie privée, maximisation de la valeur produite pour l’ensemble de la société… Tout cela en évitant, bien sûr, de peser négativement sur l’activité des entreprises en général ou d’une entreprise en particulier.” Sur un terrain juridique à défricher et que ne manqueront pas de miner les acteurs dans le collimateur, l’heure sera à “la concertation avec les parties prenantes. Les études d’impact préalables et l’expérimentation peuvent nous être d’une grande aide, comme l’est le benchmark international.”

Conscient de la complexité du problème, le gouvernement a confié à Laurent Cytermann, le rapporteur général adjoint du Conseil d’État Conseil d’Etat, une mission sur les données d’intérêt général, dont les conclusions doivent être rendues d’ici la mi-juillet.

“La problématique est de les fournir dans des niveaux élevés de qualité, de constance et de stabilité”, rajoute Simon Chignard. Des études récentes montrent que ce chantier devrait être conséquent : “les entreprises françaises estiment que 19% de leurs données sont erronées”, pointe celle-ci, et celle-là indique que le nettoyage des données pompent les deux tiers du temps de travail des data scientists.

Toutefois, être confronté à ce problème sera un bon signe, celui que le Parlement aura réussi à graver dans la loi cette notion.

Haut de page

0

Commentaire

Réagir
Publicité
Publicité

Télécharger
l'appli!

En savoir plus

Formations d’experts

Mots-clés

Thèmes abordés EconomieNumériqueOpen data

0 Commentaire

Ajouter un commentaire
  1. Ajouter un commentaire

      Votre e-mail ne sera pas visible

    Conformément à la loi "Informatique et libertés" du 6 janvier 1978, vous pouvez accéder aux informations vous concernant, les rectifier ou vous opposer à leur traitement et à leur transmission éventuelle à des tiers en écrivant à : Groupe Moniteur - 17, rue d'Uzès 75018 Paris cedex 02 ou en cliquant ici.