Fermer

Déjà inscrit(e) ?

Mot de passe oublié ?

Identifiant et/ou mot de passe non valides

Nous n’avons pas reconnu votre email, veuillez indiquer un email valide, utilisé lors de la création de votre compte.

Un message avec vos codes d'accès vous a été envoyé par mail.

Pas encore inscrit(e) ?

Inscrivez-vous pour accéder aux services de LaGazette.fr et à la gestion de vos Newsletters et Alertes.

M'inscrire gratuitement

Menu

Déjà inscrit(e) ?

Mot de passe oublié ?

Identifiant et/ou mot de passe non valides

Nous n’avons pas reconnu votre email, veuillez indiquer un email valide, utilisé lors de la création de votre compte.

Un message avec vos codes d'accès vous a été envoyé par mail.

Pas encore inscrit(e) ?

Inscrivez-vous pour accéder aux services de LaGazette.fr et à la gestion de vos Newsletters et Alertes.

M'inscrire gratuitement
  • Accueil
  • Actualité
  • France
  • Rapport Gorce sur l’open data et la vie privée : des hypothèses anxiogènes peu convaincantes

Données publiques

Rapport Gorce sur l’open data et la vie privée : des hypothèses anxiogènes peu convaincantes

Publié le 16/04/2014 • Par Sabine Blanc • dans : France

opendata
Maksim Kabakou - Fotolia.com
Les sénateurs Gaëtan Gorce et François Pillet ont présenté mercredi 16 avril 2014 les conclusions de leur rapport sur l’open data et la protection de la vie privée. Ils avancent vingt propositions dont certaines pourraient aboutir à davantage de frilosité. L’ampleur des risques, point de départ de ce travail, reste floue.

Paradoxalement la remise du rapport sénatorial sur l’open data et la protection de la vie privée a débuté par un vieux réflexe à l’encontre de l’esprit de la gouvernance ouverte : le rapport était proposé en accès restreint dès ce mercredi pour les journalistes, « pour donner des éléments nourrissant les articles », en attendant une mise à disposition pour tout le monde vendredi 18 avril. Peine perdue, le voici.

La présentation du rapport a aussi commencé par des propos rassurants du sénateur Gaëtan Gorce (PS, Nièvre), co-auteur, adressés à ceux qui craignent que ce travail ne viennent freiner l’ouverture des données publiques : « Nous n’avons pas travaillé dans cet état d’esprit », a-t-il promis. Des termes réitérés par son co-auteur, François Pillet (UMP, Cher). Au contraire, il s’agirait de rassurer pour mieux libérer

« Menaces considérables » – Il faut dire que Gaëtan Gorce n’a pas la réputation d’être un ami de l’open data. Aux origines de ce travail, il y a en effet un billet alarmiste du sénateur taclant « l’ingénuité numérique » et appelant à « stopper les développements de l’Open-Data tant qu’un cadre juridique respectueux de la vie privée n’aura pas été arrêté », arguant des « menaces considérables que [ce projet] représente déjà pour le respect de la vie privée.[…] Certes, aucune information « personnelle » détenue par les administrations ne sera en principe directement accessible : sauf que, par recoupement des données brutes fournies par les tribunaux, les services d’état-civil ou ceux du cadastre, voire avec celles (le Big-Data) dont des entreprises sont déjà en possession (comme Google ou Facebook), on pourra très facilement reconstituer le profil de chacun d’entre nous. C’est même la perspective d’un fichage généralisée à des fins privées qui réapparaît ainsi subrepticement », s’insurgeait le sénateur.

Cette position avait provoqué une bronca des acteurs de l’ouverture des données, agents de l’Etat et société civile, et pour cause : le cadre légal, protecteur, existe déjà, et s’articule autour de deux grands textes fondateurs datant de 1978, la loi Cada pour la partie accès aux données, et la loi Informatique et libertés pour la protection de la vie privée. C’est ce qu’indique d’ailleurs le rapport, à rebours des discours alarmistes de naguère : « Le cadre juridique de l’open data est relativement protecteur. Les premières données diffusées à ce stade ne paraissent pas, à de rares exceptions, présenter de danger pour la vie privée de nos concitoyens. »

La recommandation numéro 1 débute d’ailleurs par un rappel à la loi et à la politique d’open data impulsée par le gouvernement Fillon et poursuivie depuis :

Poser le principe que l’administration est tenue de mettre en ligne progressivement, en les anonymisant si nécessaire, toutes les bases de données qu’elle détient et qui seraient susceptibles d’être communiquées à un citoyen s’il en fait la demande ou qui font l’objet d’une diffusion publique sur un autre support.

« Coûts déraisonnables de gestion » – Les rapporteurs sont particulièrement inquiets des possibilités de réidentification des citoyens, en particulier par recoupement. Dans ce sens, ils préconisent des mesures qui contiennent, en germe, des arguments pour ceux qui sont hostiles à l’open data ou qui ont simplement d’autres priorités. La deuxième partie de la première recommandation pose ainsi une limite :

L’administration ne pourrait s’y opposer qu’en raison des coûts déraisonnables de gestion que cette mise en ligne imposerait (notamment les coûts d’anonymisation éventuelle), ou du risque avéré, qu’en dépit des précautions prises, des informations personnelles puissent être ré-identifiées.

Alors que le rapport plaide pour une clarification du cadre, il introduit lui-même du flou : qu’entend-on par « raisonnable » ? Quid des inégalités territoriales ? Il renvoie aux acteurs privées et aux citoyens le financement de l’anonymisation dans la proposition 19, à rebours du mouvement de suppression des redevance suite au rapport Trojette :

Garantir le financement par l’État des mesures d’anonymisation des données personnelles contenues dans des jeux de données publiques. Ne pas renoncer par principe au prélèvement d’une redevance en présence de coûts d’anonymisation élevés. Encourager le financement coopératif de l’anonymisation.

De même, la recommandation 4 demande à être précisée :

Le cas échéant, examiner l’opportunité d’étendre les cas, définis par la loi, dans lesquels, compte tenu de l’intérêt général qui s’y attache, des jeux de données incluant des données personnelles peuvent, par exception, être diffusés en ligne et ouverts aux réutilisations.

Redite – Les propositions 7 et 8 relèvent encore de la redite, même si l’application en serait sans doute difficile, comme dans le cas des bases de données de santé auxquels certains organismes ont déjà accès :

En cas de risque avéré sur les données personnelles, impossible à éliminer par des procédés d’anonymisation, refuser l’ouverture des données ou, si le bénéfice social attendu de cette ouverture est jugé trop important, procéder à une ouverture restreinte de cette base. Concevoir à cette fin un continuum de solutions d’accès aux données, allant de l’open data, jusqu’aux modes d’accès les plus sélectifs.

Mesure non chiffrée – Les quatre propositions pour « renforcer l’assistance aux acteurs de l’open data » relèvent du bon sens. Elles sont déjà aussi mis en oeuvre d’une certaine façon. Ainsi la « structure dédiée à la protection des données à caractère personnel et chargée d’assister les administrations », dont la création est demandée, existe déjà : c’est la Cnil, à la différence près qu’elle n’est pas rattachée à Etalab, et dont Gaëtan Gorce est d’ailleurs membre. Elle vient de publier les résultats d’une consultation sur le sujet, y compris sur Data.gouv. Par ailleurs, les sénateurs n’ont pas chiffré le coût de ces mesures.

Certaines préconisations semblent par ailleurs traduire une méconnaissance du sujet de travail. « Nous ne sommes pas de grands techniciens », a précisé M. Pillet. Mais nul besoin de posséder un diplôme d’ingénieur en informatique pour comprendre que, à l’heure du web, cette proposition est techniquement inapplicable :

Prévoir que l’administration définisse une stratégie de rapatriement ou de suppression des jeux de données compromis, afin de remédier rapidement à la diffusion accidentelle d’informations personnelles.

Une fois qu’un jeu de données est mis en ligne en open data, il est téléchargeable par n’importe qui sur son ordinateur, duplicable, rediffusable. Wikileaks ou l’affaire Snowden sont là pour montrer que même les organismes les plus puissants sont démunis une fois une information diffusée sur la toile.

Relativité culturelle – Autre dimension qui aurait méritée davantage d’examen,  celle de la relativité culturelle de la notion de données personnelles : en France, on ne peut pas connaître le montant des impôts des individus, et l’INSEE avait été prise en faute à ce sujet. Mais en Norvège, ce chiffre est public. Et comme l’a rappelé Alexandre Léchenet, datajournaliste au Monde, “est-ce que les données nominatives des médecins sont des données personnelles ?”, faisant allusion à l’affaire Fourmisanté. Les sénateurs ont expliqué s’en être tenu à la définition légale actuelle.

La portée de ces propositions semble d’autant plus limitée que les deux exemples mis en exergue concernant les problèmes liés à l’anonymisation semblent, d’une part éloignées des « grandes menaces », d’autres part, ne relèvent pas de données publiques mais de bases de données d’utilisateurs mises à disposition par des opérateurs privées, en l’occurence AOL et Netflix.

« Une minorité des données détenues par les collectivités territoriales » – On peut de manière plus générale déplorer que le rapport ne propose pas davantage d’informations s’agissant de la part des bases de données déjà mises en open data et contenant des données personnelles anonymisées. Les deux sénateurs ne se sont pas attelés à cette recension, même sur un échantillon de portails. Les propos assez laconiques de M. Pillet sur twitter relativisent d’ailleurs l’ampleur des données concernées :

Quoiqu’il en soit, les deux sénateurs ne sont pas convaincus par la politique d’opendata. « On ne sait pas trop pourquoi le gouvernement a engagé le processus », entre bénéfices pour la démocratie et l’économie, a indiqué Gaëtan Gorce, évoquant l’absence de stratégie, malgré pourtant la feuille de route, publique, du gouvernement.

En parallèle, une mission commune d’information du Sénat se penche sur l’ouverture des données publiques, avec des a priori plus favorables puisque sa rapporteuse, Corinne Bouchoux (EELV, Maine-et-Loire), siège à la Cada. Interrogé sur les suites législatives, Gaëtan Gorce a répondu qu’elles dépendraient des conclusions de cette MCI, attendues au mois de juin.

Cet article est en relation avec le dossier

1 Réagir à cet article

Nos offres d'emploi

Plus de 1000 offres d'emploi !

TOUTES LES OFFRES D'EMPLOI

Aujourd'hui sur les clubs experts gazette

Nos services

Prépa concours

CAP

Évènements

Gazette

Formations

Gazette

Commentaires

Rapport Gorce sur l’open data et la vie privée : des hypothèses anxiogènes peu convaincantes

Votre e-mail ne sera pas publié

fabien

28/04/2014 10h57

Quand on voit Facebook, Google et Apple combien ils sont prêts à dépenser pour récupérer de la data c’est vraiment l’avenir. ça sera à qui aura le plus de données.
merci pour l’article vraiment sympa.

A+
Fabien consultant seo

Commenter

Déjà inscrit(e) ?

Mot de passe oublié ?

Identifiant et/ou mot de passe non valides

Nous n’avons pas reconnu votre email, veuillez indiquer un email valide, utilisé lors de la création de votre compte.

Un message avec vos codes d'accès vous a été envoyé par mail.

Pas encore inscrit(e) ?

Inscrivez-vous pour accéder aux services de LaGazette.fr et à la gestion de vos Newsletters et Alertes.

M'inscrire gratuitement
 
En poursuivant votre navigation sur ce site, vous acceptez l'utilisation de cookies pour vous proposer des services et offres adaptés à vos centres d'intérêt. OK En savoir plus X