En poursuivant votre navigation sur ce site, vous acceptez l'utilisation de cookies pour vous proposer des services et offres adaptés à vos centres d'intérêt. OK En savoir plus X
Déposez votre CV Fournisseurs du secteur public

Logo Gazette.fr

Innovation publique

Les données personnelles, une denrée sous-utilisée par les collectivités

Publié le • Mis à jour le • Par • dans : Dossiers d'actualité, France

Simon Chignard © Etalab

Big data et open data se heurtent aux contraintes qu'implique le traitement des données à caractère personnel. C'est pourtant de la possibilité de relier des données que de nouveaux services pourront naître, estime Simon Chignard, consultant indépendant, auteur des ouvrages Datanomics et Open Data.

Voir le sommaire

Cet article fait partie du dossier

Données personnelles : un gisement sous haute protection

 

Pourquoi les collectivités utilisent-elles encore si peu les données à caractère personnel ?

Elles consomment beaucoup de données statistiques, démographiques, ou venant de l’exploitation de leurs systèmes d’information, mais, les données à caractère personnel ne sont pas les premières qu’elles imaginent valoriser, notamment parce qu’elles sont plus sensibles. Elles effraient les collectivités qui craignent de sortir du cadre légal. Il est vrai, d’ailleurs, que la CNIL procède régulièrement à des contrôles au sein de collectivités. Cependant, elles pourraient s’autoriser beaucoup plus de traitements qu’elles ne le font actuellement. Le fait que nombre de directeurs soient juristes de formation n’encourage probablement pas à sortir d’un cadre bien balisé.

Vous parlez aussi de blocage culturel…

En effet, les collectivités ont tendance à penser que tout ce qu’elles ont besoin de savoir sur leurs usagers, elles l’ont déjà dans leurs bases de données métier. Mais ce n’est certainement pas le cas. Outre les données de leurs délégataires, les données provenant de réseaux sociaux comme Facebook pourraient aussi leur apporter des éléments intéressants sur les gens qui habitent, travaillent sur leur territoire. Des acteurs comme Waze, Uber ou des opérateurs mobiles pourraient ramener des informations complémentaires aux capteurs qu’elles déploient… D’autant que ces informations, qui ont été anonymisées par le fournisseur, ne dépendent pas de la Loi informatique et liberté !

Quelle est la valeur d’une donnée à caractère personnel ?

La première valeur d’une donnée, personnelle ou non, n’est pas monétaire. C’est d’abord et avant tout une valeur de levier : l’usage qui va en être fait et qui va permettre de changer les processus de décision ou de produire différemment certains services. C’est donc la capacité à relier une donnée à une autre, de la croiser, qui fait sa valeur. Mais, quand on est sur des données à caractère personnel, tout n’est pas permis. Il faut notamment justifier que la finalité du traitement est valable. Par exemple, il sera difficile de trouver une finalité légale au fait de croiser le fichier des parents d’élèves avec celui des électeurs.

Quels impacts auraient ces croisements pour les collectivités ?

L’analyse des données à caractère personnel permet de mieux rendre compte de la réalité, que si on utilise uniquement des statistiques. On ne traite plus le cas d’un groupe d’individus, de grandes masses, mais, celui par exemple, de telle famille avec deux enfants. Cela permet de monter en résolution, d’avoir une connaissance beaucoup plus fine de son territoire, et donc d’être plus performant et plus rapide dans ses décisions. Si chaque direction est dotée des outils d’analyse adéquats, elle peut prendre des micro décisions, plus fréquentes et plus décentralisées. Elle pourra tester différents paramètres et faire les choix qui s’adaptent le mieux au contexte.

Il faut cependant rester attentif à la notion d’égalité de traitement. On peut fixer des tarifs différents en fonction du quotient familial mais il n’est pas possible, pour une collectivité, d’aller jusqu’à instaurer un tarif individuel, comme pourrait le faire une entreprise privée.

Open data et données à caractère personnel sont-ils incompatibles ?

L’open data s’arrête là où commencent les données à caractère personnel. Car, si le fondement juridique de l’ouverture des données est la loi CADA, la remise en cause de la vie privée d’un individu empêchera la publication du jeu de données.

De plus, sous certains seuils, le secret statistique ne peut plus être respecté, et des données peuvent devenir à caractère personnel. Les collectivités doivent être attentives à cela avant de publier un jeu. Par exemple, un fichier national donnait le montant des remboursements médicaux par département, par année et par spécialité. Dans certains départements, des spécialités ne comptaient qu’un praticien, ce qui renforçait le risque de ré-identification. Ce fichier a donc été dû être modifié avant sa publication pour appliquer les règles du secret statistique : pas de publication d’informations concernant moins de 3 individus. L’anonymisation des données à caractère personnel de manière fiable et irréversible constitue un véritable enjeu.

Et le big data ?

La promesse du big data se heurte à la problématique des données personnelles. Sa création de valeur dépend notamment de ce que l’on peut faire en matière de croisement. Le principe du consentement préalable, sur les données à caractère personnel, limite la possibilité de les réutiliser. Il est en effet difficile de demander un consentement pour des traitements dont on n’a pas encore eu l’idée ! L’Europe comme les États-Unis butent jusqu’à présent sur cette problématique, alors qu’ils avaient portant opté pour des approches très différentes.

Quels dispositifs pourrait-on mettre en œuvre pour permettre leur croisement ?

Il existe plusieurs pistes. La première serait de redonner le contrôle de ses données personnelles à chaque individu. Ainsi, une ville pourrait communiquer à chacun de ses habitants toutes les données qu’elle a collectées au fil des années, et en échange, leur demander s’ils sont d’accord pour qu’elle en utilise certaines afin d’améliorer, par exemple, son offre culturelle. Cette piste du « self data » est aujourd’hui expérimentée par la Fondation Internet nouvelle génération (Fing) dans le cadre du programme Mes Infos. On pourrait également revoir le cadre réglementaire, et raisonner non plus en termes de finalité mais selon les types de données. Elles pourraient être classées en fonction de leur niveau de sensibilité, avec en face, des autorisations de croisement différentes. Toutes les données n’ont pas la même sensibilité : un code postal, un lieu de naissance ou l’orientation sexuelle d’un individu ne remettent pas en cause de la même manière sa vie privée. Actuellement ces deux données à caractère personnel sont pourtant soumises aux mêmes contraintes.

Haut de page

Publicité
Publicité

Télécharger
l'appli!

En savoir plus

Formations d’experts

Mots-clés

Thèmes abordés Innovation - recherche et développementNumériqueOpen data