L’ouverture des données publiques depuis 2011 s’est effectuée autour du triptyque suivant : les données ne coûtent rien à produire, il faut donc les diffuser le plus largement possible, avec un minimum d’encadrement et gratuitement car elles permettront la création d’un nouveau marché puissant composé de nouvelles entreprises (start-up).
Ces croyances ont vécu.
L’impact économique : on n’est pas à l’attendu
Avec le temps, l’évidence apparaît que, passé le versement des données par les grands producteurs institutionnels (INSEE, INPI, IGN, DILA…) de leurs bases de données de grande qualité autrefois payantes, ces arbres avaient caché la forêt et qu’il était plus difficile pour les ministères et encore plus pour les collectivités territoriales d’ouvrir massivement leurs données.
L’ouverture des données de ces dernières s’est d’ailleurs déroulée dans un maelström complet, où chaque région, chaque département, chaque ville utilisait ses propres formats, entraînant une absence d’interopérabilité des données et débouchant, fort logiquement, sur l’impossibilité de consolider les données à l’échelon départemental, régional ou national.
Les coûts cachés de l’ouverture
On s’est aussi aperçu que les données supportaient de nombreux coûts cachés (collecte, traitement, format, fréquence de mise à jour, anonymisation, hébergement, sécurisation, diffusion, plateformes …) et supposaient la création d’une organisation nouvelle spécifique.
Malgré les constants et louables efforts de la structure interministérielle Etalab pour animer et développer une communauté de réutilisateurs de données publiques avec une mise en valeur de meilleurs use-cases, on a pu constater que personne n’était en mesure, outre le nombre de téléchargements et de réutilisation, de déterminer un éventuel chiffre d’affaires global généré par la réutilisation des données publiques.
On a enfin fait le constat qu’une grande majorité des données étaient complexes à exploiter et supposaient une forte expertise technique dont le grand public ne disposait pas.
Or, la donnée devient, chaque jour un peu plus, une arme économique et stratégique dans le monde numérique. Pourquoi ? Parce que tous les outils d’intelligence artificielle, quelle que soit leur nationalité, réclament de plus en plus de données, mais surtout des données de bonne qualité, tant pour l’entraînement que l’exploitation. Ici encore, mécaniquement, la valeur économique des données grimpe.
Surtout, on comprend que les données donnent, sur celui qui les diffuse, des informations parfois gênantes et qu’en croisant de plus en plus de données, on accroît mécaniquement le pouvoir de révélation de celui qui les réutilise (voir à ce sujet l’article du Canard enchaîné « opendata : attention à l’excès de transparence » sur le Registre des sociétés, 2022).
Et alors que le monde numérique reproduit de plus en plus fidèlement la réalité géostratégique découpant le globe entre amis et ennemis, nous continuons, impavidement, à diffuser à l’encan des données de haute qualité dans des domaines stratégiques tels que la géolocalisation, la cartographie, le transport, l’utilisation du sol et du sous-sol, les bâtiments…
Que faire ?
Dans ce monde numérique brutal, instable et complexe, il est plus que jamais utile de rappeler que toute ouverture de données – surtout publiques – doit donner lieu à un audit politique et stratégique préalable devant être régulièrement tenu à jour en fonction des événements. Serait-il normal, alors que les pays européens imposent un embargo économique sur la Russie, de continuer à lui envoyer des informations stratégiques ?
De même, il est indispensable d’identifier à qui s’adressent les données et les usages qui pourraient en être faits.
Or, le contrat de licence ouverte élaboré par Etalab n’est pas adapté à ce nouveau contexte. Il est souhaitable qu’il puisse être complété par des conditions générales d’utilisation précisant les responsabilités du producteur et du réutilisateur, définissant les usages interdits et précisant que la livraison des données n’est opérationnelle qu’à compter de la signature de ces conditions et qu’elle peut être interrompue en cas de manquement grave.
Une redevance pour les données stratégiques
Bien évidemment, tout ce qui précède n’est applicable qu’aux données stratégiques du pays et ne concerne en aucun cas les données de transparence démocratiques, qu’elles émanent de l’Etat, des régions ou des collectivités territoriales.
On conclura sur le modèle économique de la gratuité obligatoire retenu par la France (à la différence des autres États-membres de l’Union européenne) pour l’ouverture de ses données publiques.
Cette doxa ne résout pas le financement à terme de la production et de la diffusion des données publiques, à fortiori dans un contexte de crise budgétaire. Cela nous amène à nous poser la question : ne faudrait-il pas, pour les données les plus stratégiques, faire supporter – via une redevance – une partie des coûts de production aux acteurs privés qui les exploitent et non au budget général de l’Etat, donc, in fine, au contribuable ?
Cet article est en relation avec les dossiers
- Ces collectivités qui prennent le train de l'IA
- Données personnelles : un gisement sous haute protection
- Faut-il surveiller la safe city ?
- Les données réinventent les politiques publiques
- Open Data et réutilisation des données publiques : des promesses vertigineuses
- Smart city : les clés de la ville intelligente
Thèmes abordés