Paradoxalement la remise du rapport sĂ©natorial sur lâopen data et la protection de la vie privĂ©e a dĂ©butĂ© par un vieux rĂ©flexe Ă lâencontre de lâesprit de la gouvernance ouverte : le rapport Ă©tait proposĂ© en accĂšs restreint dĂšs ce mercredi pour les journalistes, « pour donner des Ă©lĂ©ments nourrissant les articles », en attendant une mise Ă disposition pour tout le monde vendredi 18 avril. Peine perdue, le voici.
La prĂ©sentation du rapport a aussi commencĂ© par des propos rassurants du sĂ©nateur GaĂ«tan Gorce (PS, NiĂšvre), co-auteur, adressĂ©s Ă ceux qui craignent que ce travail ne viennent freiner lâouverture des donnĂ©es publiques : « Nous nâavons pas travaillĂ© dans cet Ă©tat dâesprit », a-t-il promis. Des termes rĂ©itĂ©rĂ©s par son co-auteur, François Pillet (UMP, Cher). Au contraire, il sâagirait de rassurer pour mieux libĂ©rer
« Menaces considĂ©rables » – Il faut dire que GaĂ«tan Gorce nâa pas la rĂ©putation dâĂȘtre un ami de lâopen data. Aux origines de ce travail, il y a en effet un billet alarmiste du sĂ©nateur taclant « lâingĂ©nuitĂ© numĂ©rique » et appelant à « stopper les dĂ©veloppements de l’Open-Data tant qu’un cadre juridique respectueux de la vie privĂ©e n’aura pas Ă©tĂ© arrĂȘtĂ© », arguant des « menaces considĂ©rables que [ce projet] reprĂ©sente dĂ©jĂ pour le respect de la vie privĂ©e.[…] Certes, aucune information « personnelle » dĂ©tenue par les administrations ne sera en principe directement accessible : sauf que, par recoupement des donnĂ©es brutes fournies par les tribunaux, les services d’Ă©tat-civil ou ceux du cadastre, voire avec celles (le Big-Data) dont des entreprises sont dĂ©jĂ en possession (comme Google ou Facebook), on pourra trĂšs facilement reconstituer le profil de chacun d’entre nous. C’est mĂȘme la perspective d’un fichage gĂ©nĂ©ralisĂ©e Ă des fins privĂ©es qui rĂ©apparaĂźt ainsi subrepticement », sâinsurgeait le sĂ©nateur.
Cette position avait provoquĂ© une bronca des acteurs de lâouverture des donnĂ©es, agents de lâEtat et sociĂ©tĂ© civile, et pour cause : le cadre lĂ©gal, protecteur, existe dĂ©jĂ , et sâarticule autour de deux grands textes fondateurs datant de 1978, la loi Cada pour la partie accĂšs aux donnĂ©es, et la loi Informatique et libertĂ©s pour la protection de la vie privĂ©e. Câest ce quâindique dâailleurs le rapport, Ă rebours des discours alarmistes de naguĂšre : « Le cadre juridique de lâopen data est relativement protecteur. Les premieÌres donneÌes diffuseÌes aÌ ce stade ne paraissent pas, aÌ de rares exceptions, preÌsenter de danger pour la vie priveÌe de nos concitoyens. »
La recommandation numĂ©ro 1 dĂ©bute dâailleurs par un rappel Ă la loi et Ă la politique dâopen data impulsĂ©e par le gouvernement Fillon et poursuivie depuis :
Poser le principe que lâadministration est tenue de mettre en ligne progressivement, en les anonymisant si neÌcessaire, toutes les bases de donneÌes quâelle deÌtient et qui seraient susceptibles dâeÌtre communiqueÌes aÌ un citoyen sâil en fait la demande ou qui font lâobjet dâune diffusion publique sur un autre support.
« CouÌts deÌraisonnables de gestion » – Les rapporteurs sont particuliĂšrement inquiets des possibilitĂ©s de rĂ©identification des citoyens, en particulier par recoupement. Dans ce sens, ils prĂ©conisent des mesures qui contiennent, en germe, des arguments pour ceux qui sont hostiles Ă lâopen data ou qui ont simplement dâautres prioritĂ©s. La deuxiĂšme partie de la premiĂšre recommandation pose ainsi une limite :
Lâadministration ne pourrait sây opposer quâen raison des couÌts deÌraisonnables de gestion que cette mise en ligne imposerait (notamment les couÌts dâanonymisation eÌventuelle), ou du risque aveÌreÌ, quâen deÌpit des preÌcautions prises, des informations personnelles puissent eÌtre reÌ-identifieÌes.
Alors que le rapport plaide pour une clarification du cadre, il introduit lui-mĂȘme du flou : quâentend-on par « raisonnable » ? Quid des inĂ©galitĂ©s territoriales ? Il renvoie aux acteurs privĂ©es et aux citoyens le financement de lâanonymisation dans la proposition 19, Ă rebours du mouvement de suppression des redevance suite au rapport Trojette :
Garantir le financement par lâEÌtat des mesures dâanonymisation des donneÌes personnelles contenues dans des jeux de donneÌes publiques. Ne pas renoncer par principe au preÌleÌvement dâune redevance en preÌsence de couÌts dâanonymisation eÌleveÌs. Encourager le financement coopeÌratif de lâanonymisation.
De mĂȘme, la recommandation 4 demande Ă ĂȘtre prĂ©cisĂ©e :
Le cas eÌcheÌant, examiner lâopportuniteÌ dâeÌtendre les cas, deÌfinis par la loi, dans lesquels, compte tenu de lâinteÌreÌt geÌneÌral qui sây attache, des jeux de donneÌes incluant des donneÌes personnelles peuvent, par exception, eÌtre diffuseÌs en ligne et ouverts aux reÌutilisations.
Redite – Les propositions 7 et 8 relĂšvent encore de la redite, mĂȘme si lâapplication en serait sans doute difficile, comme dans le cas des bases de donnĂ©es de santĂ© auxquels certains organismes ont dĂ©jĂ accĂšs :
En cas de risque aveÌreÌ sur les donneÌes personnelles, impossible aÌ eÌliminer par des proceÌdeÌs dâanonymisation, refuser lâouverture des donneÌes ou, si le beÌneÌfice social attendu de cette ouverture est jugeÌ trop important, proceÌder aÌ une ouverture restreinte de cette base. Concevoir aÌ cette fin un continuum de solutions dâacceÌs aux donneÌes, allant de lâopen data, jusquâaux modes dâacceÌs les plus seÌlectifs.
Mesure non chiffrĂ©e – Les quatre propositions pour « renforcer lâassistance aux acteurs de lâopen data » relĂšvent du bon sens. Elles sont dĂ©jĂ aussi mis en oeuvre dâune certaine façon. Ainsi la « structure deÌdieÌe aÌ la protection des donneÌes aÌ caracteÌre personnel et chargeÌe dâassister les administrations », dont la crĂ©ation est demandĂ©e, existe dĂ©jĂ : câest la Cnil, Ă la diffĂ©rence prĂšs quâelle nâest pas rattachĂ©e Ă Etalab, et dont GaĂ«tan Gorce est d’ailleurs membre. Elle vient de publier les rĂ©sultats dâune consultation sur le sujet, y compris sur Data.gouv. Par ailleurs, les sĂ©nateurs nâont pas chiffrĂ© le coĂ»t de ces mesures.
Certaines prĂ©conisations semblent par ailleurs traduire une mĂ©connaissance du sujet de travail. « Nous ne sommes pas de grands techniciens », a prĂ©cisĂ© M. Pillet. Mais nul besoin de possĂ©der un diplĂŽme dâingĂ©nieur en informatique pour comprendre que, Ă lâheure du web, cette proposition est techniquement inapplicable :
PreÌvoir que lâadministration deÌfinisse une strateÌgie de rapatriement ou de suppression des jeux de donneÌes compromis, afin de remeÌdier rapidement aÌ la diffusion accidentelle dâinformations personnelles.
Une fois quâun jeu de donnĂ©es est mis en ligne en open data, il est tĂ©lĂ©chargeable par nâimporte qui sur son ordinateur, duplicable, rediffusable. Wikileaks ou lâaffaire Snowden sont lĂ pour montrer que mĂȘme les organismes les plus puissants sont dĂ©munis une fois une information diffusĂ©e sur la toile.
RelativitĂ© culturelle – Autre dimension qui aurait mĂ©ritĂ©e davantage dâexamen, celle de la relativitĂ© culturelle de la notion de donnĂ©es personnelles : en France, on ne peut pas connaĂźtre le montant des impĂŽts des individus, et lâINSEE avait Ă©tĂ© prise en faute Ă ce sujet. Mais en NorvĂšge, ce chiffre est public. Et comme lâa rappelĂ© Alexandre LĂ©chenet, datajournaliste au Monde, âest-ce que les donnĂ©es nominatives des mĂ©decins sont des donnĂ©es personnelles ?â, faisant allusion Ă lâaffaire FourmisantĂ©. Les sĂ©nateurs ont expliquĂ© sâen ĂȘtre tenu Ă la dĂ©finition lĂ©gale actuelle.
La portĂ©e de ces propositions semble dâautant plus limitĂ©e que les deux exemples mis en exergue concernant les problĂšmes liĂ©s Ă lâanonymisation semblent, dâune part Ă©loignĂ©es des « grandes menaces », dâautres part, ne relĂšvent pas de donnĂ©es publiques mais de bases de donnĂ©es dâutilisateurs mises Ă disposition par des opĂ©rateurs privĂ©es, en lâoccurence AOL et Netflix.
« Une minoriteÌ des donneÌes deÌtenues par les collectiviteÌs territoriales » – On peut de maniĂšre plus gĂ©nĂ©rale dĂ©plorer que le rapport ne propose pas davantage dâinformations sâagissant de la part des bases de donnĂ©es dĂ©jĂ mises en open data et contenant des donnĂ©es personnelles anonymisĂ©es. Les deux sĂ©nateurs ne se sont pas attelĂ©s Ă cette recension, mĂȘme sur un Ă©chantillon de portails. Les propos assez laconiques de M. Pillet sur twitter relativisent dâailleurs lâampleur des donnĂ©es concernĂ©es :
François Pillet : âOn n’imagine pas assez l’importance des donnĂ©es qui n’ont aucun caractĂšre personnelâ #OpenData #directsĂ©nat
â Senat_direct (@Senat_Direct) April 16, 2014
Quoiquâil en soit, les deux sĂ©nateurs ne sont pas convaincus par la politique dâopendata. « On ne sait pas trop pourquoi le gouvernement a engagĂ© le processus », entre bĂ©nĂ©fices pour la dĂ©mocratie et lâĂ©conomie, a indiquĂ© GaĂ«tan Gorce, Ă©voquant lâabsence de stratĂ©gie, malgrĂ© pourtant la feuille de route, publique, du gouvernement.
En parallĂšle, une mission commune dâinformation du SĂ©nat se penche sur lâouverture des donnĂ©es publiques, avec des a priori plus favorables puisque sa rapporteuse, Corinne Bouchoux (EELV, Maine-et-Loire), siĂšge Ă la Cada. InterrogĂ© sur les suites lĂ©gislatives, GaĂ«tan Gorce a rĂ©pondu quâelles dĂ©pendraient des conclusions de cette MCI, attendues au mois de juin.








