Fermer

Déjà inscrit(e) ?

Mot de passe oublié ?

Identifiant et/ou mot de passe non valides

Nous n’avons pas reconnu votre email, veuillez indiquer un email valide, utilisé lors de la création de votre compte.

Un message avec vos codes d'accès vous a été envoyé par mail.

Pas encore inscrit(e) ?

Inscrivez-vous pour accéder aux services de LaGazette.fr et à la gestion de vos Newsletters et Alertes.

M'inscrire gratuitement

Menu

Déjà inscrit(e) ?

Mot de passe oublié ?

Identifiant et/ou mot de passe non valides

Nous n’avons pas reconnu votre email, veuillez indiquer un email valide, utilisé lors de la création de votre compte.

Un message avec vos codes d'accès vous a été envoyé par mail.

Pas encore inscrit(e) ?

Inscrivez-vous pour accéder aux services de LaGazette.fr et à la gestion de vos Newsletters et Alertes.

M'inscrire gratuitement

Open data

« L’open data ne devrait être qu’une des modalités d’ouverture des données publiques »

Publié le 21/07/2017 • Par Romain Mazon • dans : Dossiers d'actualité, France

cadenas-une
Flickr CC by subcircle
Le volet open data de la loi Lemaire a été concrétisé par la parution, depuis le début 2017, de plusieurs décrets d’application. Les attentes en termes d’usage, et d’activité économique restent considérables. Mais sont-elles réalistes ? Le point de vue de Denis Berthault, directeur du développement en ligne chez un grand éditeur juridique et co-animateur du groupe de travail « données publiques » du GFII (Groupement français de l'industrie de l'information).

Après la loi République Numérique, en tant que réutilisateur professionnel, quel regard portez-vous sur le paysage législatif et réglementaire de l’opendata ?

Denis Berthault (1) Je retiens le décret sur les données de référence qui a l’immense avantage de structurer et de donner un cadre aux producteurs publics sur ce que devrait être une diffusion avec des engagements de qualité. Aucun pays n’a encore fait ça. Les fichiers sélectionnés dans le service public de la donnée sont les bons. Le GFII en a proposé, et il y a d’ailleurs d’autres candidats, mais il faut d’abord que cela monte en puissance, en organisation, pour que les niveaux de qualité attendus, précisés récemment par un décret, soient tenus. Mais je salue cette initiative française, tout à fait de nature à permettre le développement d’une industrie numérique. C’est bon pour l’administration, c’est bon pour les collectivités, pour les associations, et pour les entreprises.

Avez-vous recensé d’autres bases de données que vous qualifieriez d’essentielles ?

Il y en a beaucoup, mais on peut évoquer l’enquête Sumer de la Dares, sur les conditions et la santé au travail, ou l’enquête trimestrielle sur l’activité et les conditions d’emploi de la main d’œuvre, la base des établissements de santé de la Drees, la carte de l’activité hospitalière, les données financières et fiscales…

Ces données essentielles ne concernent que des données de l’Etat, et d’administrations de missions…

C’est exact. Ces données viennent de professionnels de la donnée, dont la mission principale est de les produire. Evidemment, garder des niveaux de qualité professionnels ne leur pose pas trop de difficultés, à part d’un point de vue budgétaire. Pour l’IGN par exemple, l’Etat a pris l’engagement de sanctuariser sa dotation. Mais on est effectivement dans un cadre particulier, qui ne peut sans doute pas être reproduit pour toutes les administrations.

Ce que j’en retiens, c’est l’exigence de qualité, de pérennité du service, qui sont des facteurs clés de succès, et de l’engagement du producteur derrière son contenu. Ce sont des notions largement méconnues en général des administrations.

Comment appréciez-vous les nouvelles licences recommandées par Etalab ?

J’apprécie moins. La « licence Etalab » est sans reproche. Par contre, la licence ODBL, qui peut avoir un intérêt pour un certain type de données, comme celles relatives à la transparence démocratique, n’est absolument pas pertinente quand on parle de données qui sont des objets de concurrence. La notion du share alike, qui échange la gratuité contre un apport de valeur ajoutée fourni par le réutilisateur, est bloquante pour les entreprises. Une entreprise ne peut remettre au pot commun les améliorations qu’elle a apporté aux données. Attention, je ne suis pas anti ODBL, cette licence peut être pertinente dans certains contextes. En revanche, elle n’est pas du tout adaptée aux besoins des professionnels qui sont dans une compétition.

Aujourd’hui, un certain nombre d’administration produisent des données publiées dans Open Street Map, qui est sous ODBL. Est-ce que cela veut dire que ces données ont peu de chances d’être réutilisées par des acteurs économiques ?

Oui bien sûr. L’ODBL en soi n’est pas un problème. Cela le devient quand l’ODBL est obligatoire et unique. Cela devient alors un frein pour les usages commerciaux de la donnée, donc une forte baisse de son potentiel de « réutilisabilité ».

Je ne suis pas anti ODBL, cette licence peut être pertinente dans certains contextes. En revanche, elle n’est pas du tout adaptée aux besoins des professionnels qui sont dans une compétition.

Les administrations auraient-elles intérêt à faire preuve de créativité, en produisant leur propre licence ?

Le décret est assez clair sur ce point, en tout cas pour les administrations centrales. Il dit que toute nouvelle forme de licence doit être agréée par le SGMAP. J’ai du mal à croire que ce soit possible, même s’il me paraît pertinent de laisser aux administrations une certaine latitude, pour adapter une licence de « tronc commun » à leur contexte particulier, par exemple les données culturelles, ou de santé. Elles proposent des contraintes différentes. J’aurais ainsi trouvé pertinent que les administrations puissent se fonder sur la licence Etalab, à laquelle elles ne pourraient pas enlever de clauses, mais qu’elles pourraient, à l’inverse, enrichir. Aujourd’hui, devoir passer par un contrôle préalable ne me paraît pas très bon.

Mais d’une certaine manière, ce décret est une fiction, car inapplicable, dans la mesure où il ne couvre pas toutes les données ni tous les cas d’usages. Prenons l’exemple des données de santé : on ne va pas accorder les mêmes droits d’utilisation ou de réutilisation à un laboratoire pharmaceutique d’un côté, et une CPAM., ou des chercheurs d’université de l’autre. Je crois beaucoup à la notion de cercles de diffusion.

D’une certaine manière, ce décret est une fiction, car inapplicable, dans la mesure où il ne couvre pas toutes les données, ni tous les cas d’usages.

Que voulez-vous dire ?

L’open data dit qu’il existe un cercle d’usages et de réutilisateurs uniques, et rien autour, sans dérogation possible. C’est une erreur fondamentale. En réalité, il existe plusieurs cercles, à commencer par l’émetteur lui-même. Et même dans la structure de l’émetteur, il y a ceux qui vont être habilités à tout voir, et ceux qui ne pourront voir, ou utiliser, qu’une partie des données. Donc, en interne, dans les services de l’administration, il y a plusieurs cercles, et ce sera aussi le cas hors de cette administration. Il va donc bien falloir discriminer, avec des notions de droits et d’habilitation. Aujourd’hui, on crée un base de données chaque fois qu’il y a un cercle de réutilisateurs. Or, ce n’est pas comme ça qu’il faut réfléchir. Il faut recenser les cercles, puis concevoir les déclinaisons de la même base de données pour s’adapter aux cercles.

Par exemple ?

Les données de santé sont l’exemple type de ces complexités. Même au stade de la production de données, même entre deux hôpitaux : les données qu’ils produisent pour les mêmes actes ne peuvent pas dialoguer, donc circuler entre eux, a fortiori avec la CNAM. L’important, c’est donc la modularité, qui permet de s’adapter aux différents cercles de réutilisateurs susceptible de se servir des données, et aux différents usages qui en découlent. Pour l’instant, l’opendata en est à son An 1, qui est «  j’ouvre ».

Et je veux d’ailleurs préciser un point. Je crois qu’il y a une espèce de perversité sémantique et juridique qui consiste à faire l’équation : ouverture des données publiques = open data. Alors que si on veut avancer, il faut considérer que l’open data est une des modalités d’ouverture des données publiques. Mais ce n’est pas la seule. Une fois qu’on a admis ce principe, on aboutit à la théorie des cercles dont je parlais.

Pourquoi ?

Pour que les administrations se lancent de façon positive, et non pas en le percevant comme une charge, sur la mise à disposition de leurs données, il faut qu’elles perçoivent qu’elles y gagnent quelque chose, que ça les améliore elles-mêmes. Elles en retirent un avantage, et on peut alors parler d’ouverture des données des administrations vers les administrations, appelons-le « A to A ». C’est un discours mobilisateur il me semble que de dire aux administrations « l’open data, c’est d’abord pour vous ! ». Ce n’est pas du tout l’open data vers les citoyens, que l’on peut désigner par « A to C », pour administration to citoyen, ou citizen. On a ensuite le « A to B », pour administration to business, pour les entreprises. Si on veut vraiment que les entreprises se saisissent de données, alors on doit jouer la qualité, l’exhaustivité, la fréquence…. Une administration ne peut y arriver que si le A to A est déjà réalisé, car pour une administration, le A to B est secondaire. Si on n’entre pas dans cette logique de modularité, et de niveaux d’exigence différents en fonction des réutilisateurs, l’open data va continuer à patiner.

C’est un discours mobilisateur que de dire aux administrations « l’open data, c’est d’abord pour vous ! »

Vous définissez donc trois cercles, en fonction d’usages projetés, ou de réutilisateurs ?

Oui, au moins trois cercles, qui ne recevront pas nécessairement un même jeu de données, mais des variantes, rendues possibles par la modularité. Cela exigera d’ailleurs de l’administration qu’elle s’oblige à un niveau de qualité constant. Si le ministère de l’Intérieur fournit un fichier au ministère des Affaires étrangères, il faudra bien qu’il s’engage sur une fréquence de mise à jour, sur la pérennité de son format et de son contenu…

Des entreprises utilisent depuis longtemps des données publiques. Or, l’open data permet de baisser le droit d’entrée pour de nouveaux acteurs. Est-ce que ce cercle « A to B » ne provoque pas un retour en arrière ?

C’est une illusion. Et avant tout, ce n’est pas parce que j’ai parlé de plusieurs cercles que je l’ai lié à une tarification. Si l’Etat veut poursuivre la politique de gratuité, libre à lui, tout le monde sera content. Mais le cas se présentera nécessairement où l’Etat n’aura pas les moyens de fournir un service de qualité attendu par des professionnels. Le rapport Trojette est très juste sur ce point : la donnée est gratuite, mais la mise à disposition peut ne pas l’être. Et il envisage plusieurs cas de figure pour tarifer cette mise à disposition, en fonction du volume de données par exemple. C’est très logique, et pertinent il me semble, dans le contexte de contraintes des finances publiques que l’on connaît.

Dans votre théorie des cercles, l’open data résiderait donc dans la mise à disposition par l’administration vers le citoyen, le « A to C » ?

Oui. Et je trouve que cette théorie des cercles a l’immense vertu de s’adapter aux usages. Dans A to A et A to B, le contexte de l’usage des données est décrit, il y a un contrat, obligatoire. On est dans une relation professionnelle et bilatérale, même quand l’administration se parle à elle-même, parce qu’elle n’est pas unique et univoque.

Est-ce que cela ne crée de la donnée appauvrie pour les citoyens ?

D’abord, j’exclus de ma réflexion les données de transparence, qui doivent être de qualité ; mais ce ne sont pas les données essentielles. Les données « A to C » peuvent sans doute permettre l’émergence d’une activité économique. Mais elle aura besoin, si elle doit se développer de plus de fiabilité, ou d’enrichissements. Alors, cela demandera un effort de traitement de la part du producteur initial de la donnée. La théorie des cercles permet de créer cette dynamique de réutilisation autour de la donnée publique. Je me situe en cela dans l’esprit de la directive de 2003, qui voulait créer une économie numérique ; et pour cela, il faut investir, inévitablement. L’investissement vient s’il y a des projets, et si les données sur lequel ils se fondent sont de qualité garanties, accompagnées de formats de livraison pérennes. Il est évident qu’on ne peut pas fournir le même service avec des données mises à jour une fois par an ou une fois par jour.

Je me situe dans l’esprit de la directive de 2003, qui voulait créer une économie numérique ; et pour cela, il faut investir, inévitablement.

Les concessionnaires de service public doivent-ils ouvrir les données de leur activité ?

Je ne suis pas un forcené du service public de la donnée. Dire aux délégataires et concessionnaires qu’il faut ouvrir sans nuance, c’est la garantie de les conduire à freiner des quatre fers, pour ne pas dévoiler ce qui peut relever du secret des affaires. Et la distinction est assez compliquée à établir entre service public de la donnée et secret des affaires, surtout si on en reste à la vision primaire de l’open data qui ne connaît que 2 états : ouvert / pas ouvert. Et j’en reviens à la logique des cercles : si on est capable de définir que, dans certains cercles, on diffusera de telle manière, différente d’un autre cercle, cela sécuriserait les producteurs privés qui mènent des missions de service public.

Justement, la loi Lemaire contient cette notion de secret industriel, assez floue pour qu’on puisse se retrancher derrière de sorte à ne plus participer à l’open data…

Mais justement ! C’est tellement blanc ou noir qu’on ne peut avoir que des blocages. D’où l’importance de définir des usages différenciés, des conditions d’accès différenciés.

Comment l’Etat et ses administrations devraient s’y prendre ?

L’idée est que les administrations préparent leurs bases de données pour être modulables, permettant des usages différenciés, « de base », ou au contraire, très exigeants.

Evidemment, la première étape consiste en un travail d’inventaire, qui décrive les types de données, leur format, leur fréquence, leurs droits d’accès éventuels, etc. C’est une démarche exigeante, qui n’a pas été faite de manière générale. Une fois qu’on a répondu à ces questions, on obtient des bases de données susceptibles d’être exportées, sous réserve de les organiser, les décrire, dans l’hypothèse où elles pourront être réutilisées dans différents cercles.

Il faudrait alors passer dans un autre contexte, où un autre organisme, pourquoi pas le SGMAP d’ailleurs, labelliserait les données en termes de qualité, puis créerait un guichet dédié aux professionnels qui ont des demandes spécifiques, plus approfondies que ce que peut proposer aujourd’hui data.gouv.fr. Les professionnels ont besoin d’un one stop shop, payant au besoin, en suivant les recommandations du rapport Trojette, qui proposerait les données dans un format « certifié », amélioré pour un usage professionnel. Cela permettrait d’offrir un service qui pourrait être à l’équilibre, et qui ne serait pas alimenté par le budget de l’Etat.

Je suis toujours un peu surpris que ce soit le citoyen qui paie, aujourd’hui, pour la création ou l’amélioration de fichiers ou de bases de données  qui vont être, dans une proportion significative, accaparés par les géants de l’Internet. Si l’open data c’est ça, ça ne peut pas marcher. L’Etat n’a pas pour mission de préparer des fichiers pour ces géants. Je trouve donc plutôt sain que ce soient les réutilisateurs, qui vont bénéficier des données, et les valoriser pour des usages qu’ils auront décrit, qui contribueront, et permettront de renforcer le système, en apportant des fonds à l’Etat. A l’heure actuelle, on est partis pour 25 ans !

L’Etat n’a pas pour mission de préparer des bases de données pour les géants de l’internet.

Les données deviendraient donc, au moins pour partie, payantes, donc leur accès serait limité. Est-ce que ça ne serait pas la fin de l’open data ?

Dans l’hypothèse que j’évoque, je ne fais absolument pas de retour en arrière ! Je ne veux pas restreindre l’accès aux données, car je parle de données de niveau professionnel, enrichies, décrites, avec une fréquence de mise à jour maximale. Et donc bien de deux cercles de diffusion a minima. L’un n’exclut pas l’autre. Il faut dépasser notre vision encore très primaire de l’open data, très « citoyenne ». Qu’on pense l’open data pour servir la transparence, la lutte contre la corruption, oui bien sûr, mais il n’y a pas que ça !

Quel regard portez-vous sur l’open data local et l’expérimentation en cours, qui consiste à favoriser une démarche commune entre toutes les collectivités ?

C’est une excellente initiative. Cela vient des intéressés eux-mêmes, avec le travail d’Open Data France et le concours du SGMAP et d’Etalab, c’est donc très vertueux. Le simple fait de se mettre d’accord sur les fichiers faisant partie du socle commun est un pas capital. On notera que, sans forcément  le conceptualiser, les collectivités travaillent ainsi sur deux cercles en même temps, vers les citoyens d’une part et pour elles-mêmes de l’autre. Mais il reste encore d’autres cercles (régions vers départements, collectivités vers intercommunalité,…). Aujourd’hui 50% des régions, une dizaine de métropoles et une vingtaine d’agglomérations ont initié des démarches d’ouverture.

On peut donc penser que ce sont les bons niveaux pour que l’open data se développe. Toutefois, plusieurs points mériteraient de faire l’objet d’une réflexion profonde…. et rapide.

En voici quelques-uns : l’implication de certaines administrations concernées par les collectivités locales, l’ardente nécessité d’harmoniser les formats et les protocoles d’échange des données, l’exploration des possibilités de mutualisation des infrastructures, des ressources humaines et des portails. Mais, plus que tout, il faut réévaluer à la hausse l’impact de l’ouverture des données tant sur la création de nouveaux services utiles à ces différents cercles, publics ou privés, que sur les gains d’efficience pour les administrations centrales et les collectivités territoriales.

Cet article fait partie du Dossier

Open Data et réutilisation des données publiques : des promesses vertigineuses

Sommaire du dossier

  1. Ce qu’il faut retenir du projet de loi pour une République numérique
  2. “L’open data par défaut ne pourra pas se faire sans médiation numérique” – Samuel Goëta
  3. Révision à la baisse de l’opendata dans les collectivités locales
  4. Open data, un nouvel élan pour le tourisme
  5. Libre accès aux données publiques : comment mettre en œuvre les nouvelles obligations
  6. En Nouvelle Aquitaine, l’observatoire Nafu affûte la connaissance du foncier grâce aux données publiques
  7. « L’open data ne devrait être qu’une des modalités d’ouverture des données publiques »
  8. Open data : l’Occitanie est un territoire-pilote
  9. Rennes construit le « service public métropolitain de la donnée »
  10. Quand les agences d’urbanisme se saisissent de l’open data
  11. Coopération public – privé et données : comment et pourquoi les collectivités doivent reprendre la main
  12. Le décret sur les données de référence, nouvelle pierre pour la généralisation de l’opendata
  13. Projet de loi Valter : un (tout) petit pas pour l’opendata
  14. Réutilisation des données publiques : des promesses vertigineuses
  15. L’open data, atout maître dans la course aux économies ?
  16. L’ouverture des données publiques en France reste perfectible
  17. Mobilités : les collectivités se rapprochent d’Uber, Waze et Blablacar
  18. La métropole, « bonne échelle pour développer le service public local de la donnée »
  19. Le fouillis des licences open data s’éclaircit [Fiche pratique]
  20. “Les données d’autorité restent un instrument de souveraineté”- Pascal Berteaud, DG de l’IGN
  21. Open data : le service public augmenté – Des données ouvertes de plus en plus cadrées
  22. Les acteurs publics, gros acheteurs des données… publiques
  23. Données publiques : une nouvelle économie des services publics en débat
  24. OaklandOpenBudget ou quand les citoyens se saisissent de l’Open Data
  25. Open data : quels coûts pour les collectivités territoriales
  26. Open data : le service public augmenté – 1. Cap sur la réutilisation
  27. Open data : le service public augmenté – 3. Des territoires riches de données
  28. Open data : le service public augmenté – 2. L’atout de la mutualisation
  29. L’open data, véritable voie de modernisation pour les administrations
  30. Open data et tourisme : un potentiel qui reste à transformer
  31. « Les collectivités, premières bénéficiaires de l’open data » – Claire Gallon, LiberTIC
  32. Open data : la transparence démocratique demeure virtuelle
  33. La FING, partenaire et centre de ressources
  34. Une évaluation sans concession mais lucide de l’open data en Loire-Atlantique

Thèmes abordés

Notes

Note 01 Directeur du développement en ligne chez un grand éditeur juridique, il a participé à la création de Légifrance. Il est co-animateur du groupe de travail « données publiques » du GFII et chargé d'enseignement dans le Master 2 Droit des données, des administrations numériques et des gouvernements ouverts » à l’université Paris 1 – Panthéon-Sorbonne Retour au texte

Réagir à cet article

Nos offres d'emploi

Plus de 1000 offres d'emploi !

TOUTES LES OFFRES D'EMPLOI

Aujourd'hui sur les clubs experts gazette

Nos services

Prépa concours

CAP

Évènements

Gazette

Formations

Gazette

Fournisseurs public expo Public Expo

Commentaires

« L’open data ne devrait être qu’une des modalités d’ouverture des données publiques »

Votre e-mail ne sera pas publié

Déjà inscrit(e) ?

Mot de passe oublié ?

Identifiant et/ou mot de passe non valides

Nous n’avons pas reconnu votre email, veuillez indiquer un email valide, utilisé lors de la création de votre compte.

Un message avec vos codes d'accès vous a été envoyé par mail.

Pas encore inscrit(e) ?

Inscrivez-vous pour accéder aux services de LaGazette.fr et à la gestion de vos Newsletters et Alertes.

M'inscrire gratuitement
 
En poursuivant votre navigation sur ce site, vous acceptez l'utilisation de cookies pour vous proposer des services et offres adaptés à vos centres d'intérêt. OK En savoir plus X