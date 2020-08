Numérique

Publié le 26/08/2020 • Par Alexandre Léchenet Laura Fernandez Rodriguez

Calcul d’un trajet, place en crèche, attribution de subventions, les algorithmes sont partout. A tel point que nombre d’administrations s’en servent sans le savoir. Ces outils permettent de gagner en efficacité, mais peuvent également entraîner des biais.

Aujourd’hui, ils concourent à optimiser les politiques publiques dans des domaines très variés, mais sont le plus souvent invisibles aux yeux des habitants, voire parfois à ceux des agents : ce sont les algorithmes, que la Commission nationale de l’informatique et des libertés (Cnil) définit comme « une suite finie et non ambiguë d’instructions permettant d’obtenir un résultat à partir d’éléments fournis en entrée ». A l’heure du big data et de la montée en puissance de l’intelligence artificielle, les territoires veulent devenir « intelligents », « connectés », pour rationaliser l’action publique et améliorer les services délivrés aux citoyens.

Les domaines d’application des algorithmes sont multiples : calcul d’un trajet, communication, traitement de grandes quantités d’informations, interprétation des signaux, simulation de certaines situations, etc. Présentés comme des assistants aux pouvoirs numériques extraordinaires mais aussi comme des « armes de destruction mathématiques », pour reprendre le titre du livre de la mathématicienne américaine Cathy O’Neil, certains algorithmes peuvent être de véritables « boîtes noires », dont les décisions sont difficiles à expliquer, ou pire, à comprendre.

Dans l’histoire de l’action publique, « les premiers usages relèvent de la sphère sociofiscale », rappelle Simon Chignard, conseiller stratégique d’Etalab au sein de la direction interministérielle du numérique, qui a réalisé, en mars 2019, un guide sur les algorithmes publics à destination des administrations. « Il s’agit d’attribuer ou de calculer le montant de prestations sociales ou des impôts. Cet usage, qui correspond à l’automatisation de tâches de calcul plus ou moins basiques, selon des règles définies par la législation en vigueur, a été initié dans les années 1970. Il reste à ce jour majoritairement utilisé. Ensuite, les administrations ont employé des algorithmes pour réaliser des appariements entre une “offre” et une “demande” (au sens large de ces termes). Par exemple, l’agence de biomédecine a recours à un algorithme pour attribuer des greffons cardiaques à des patients […]. Enfin, l’usage d’algorithmes apprenants (de type machine learning) est beaucoup plus récent et n’est pas encore généralisé dans les administrations publiques. »

Une administration plus juste et efficace ?

Les algorithmes apprenants tirent profit de l’augmentation de la capacité des ordinateurs. Ils traitent un grand nombre d’informations pour offrir des solutions adaptées. Tel est le cas des algorithmes de recommandation sur les plateformes d’achat en ligne, qui proposent des produits similaires à ceux choisis par un client, grâce à l’historique des achats de tous les clients. Ou des logiciels de police prédictive, qui se nourrissent des données sur les arrestations et de celles socioéconomiques pour – prétendent-ils – identifier des zones ou des périodes de temps qu’ils considèrent comme plus criminogènes, et dont l’efficacité est contestée.

« Cette informatisation permet de simplifier l’administration », notent Serge Abiteboul et Gilles Dowek dans « Le Temps des algorithmes » (éd. Le Pommier), mais également de la rendre « plus efficace » et « plus juste, car elle peut, plus facilement que des personnes, avec leurs habitudes et leurs préjugés, imposer que la même règle s’applique à tous ». Mais, ajoutent-ils, « cette informatisation de l’administration présente des risques pour les citoyens les plus vulnérables, par exemple, quand certaines demandes de prestations sociales doivent être effectuées en ligne, alors que les bénéficiaires potentiels de ces prestations sont parmi les personnes les moins connectées ».

« Dans la plupart des cas, ces outils sont des aides à la décision ; ils ne prennent pas de décision de manière automatisée, souligne Simon Chignard. Il y a d’ailleurs un enjeu fort sur la compréhension par le public de ces systèmes : quelle est la répartition des rôles entre la machine et l’homme ? A quelle phase de la décision interviennent ces outils algorithmiques ? » Cette compréhension pourra être aidée par des dispositions légales. La loi pour une République numérique de 2016 impose d’indiquer aux personnes concernées que les décisions sont prises avec l’aide d’un processus algorithmique, lorsque c’est le cas. Et si l’algorithme seul prend la décision, depuis le 1er juillet 2020, la mention est obligatoire, sous peine de nullité.

Des places en crèche dans la moulinette

Les dispositions légales exigent donc des collectivités d’identifier ces algorithmes. Une note d’impact du décret de la loi « Lemaire » estimait à une trentaine le nombre d’algorithmes concernés dans l’ensemble des grandes collectivités. Ces derniers sont particulièrement difficiles à identifier, « soit parce qu’ils ne sont pas encore conscientisés, soit qu’il y en a encore assez peu dans les collectivités locales, qui ne sont pas dans l’automatisation du service public », explique Michaël Bideault, ingénieur des connaissances à l’association Villes internet, qui relève que, sur les 35 000 projets numériques des collectivités répertoriées dans l’Atlaas développé par l’association, aucune ne fait explicitement référence à un algorithme.

Pourtant, des cas d’usages existent. L’attribution de subventions ou la répartition de places en crèche peuvent être considérées comme des procédures algorithmiques, en proposant des solutions en fonction de critères prédéfinis, même si la plupart du temps, la décision finale revient à une commission ad-hoc. A Valence Romans agglo (54 communes, 220 200 hab.), dans le cadre d’un travail de recherche avec la Caisse nationale des allocations familiales (Cnaf), un algorithme a été utilisé pour attribuer les places en crèche au printemps 2020.

« L’algorithme a été programmé en fonction de nos critères habituels et alimenté par un tableau sur les places libres dans nos structures », explique l’agglomération. Pendant le confinement, faute de pouvoir réunir les membres de la commission d’attribution, cet algorithme a procédé à l’attribution des places. Une fois l’ensemble des critères sociaux rendus lisibles pour la machine, ce qui peut prendre un certain temps, l’algorithme développé par la Cnaf prend en compte plusieurs vœux formulés par les familles et attribue en quelques secondes les places disponibles. Ainsi, après la première session d’attribution, en mai, 40 % des 1 015 demandes avaient été satisfaites, et 80 % des familles avaient reçu leur premier ou deuxième vœu.

Les cas d’usages existent donc, et une liste exhaustive reste à écrire collectivement. Jacques Priol, fondateur du cabinet Civiteo et président de l’observatoire Data Publica, relève que ce champ récent n’a pas fait l’objet de jurisprudence. « Le droit de la donnée publique est un domaine nouveau, et celui de l’algorithmie publique est une sous-catégorie encore moins identifiée et stabilisée, pour laquelle nous n’avons, hormis sur le logiciel Parcoursup, aucune jurisprudence de référence. Et aucune concernant l’action publique locale. » Dans l’intervalle, autant s’y sensibiliser et s’y conformer.

Une apparente neutralité

« Des décisions au moins en partie automatisées, il y en a partout, mais le sujet est minoré, voire invisibilisé », estime, de son côté, Hubert Guillaud, membre de la Fondation internet nouvelle génération (Fing). Après ses programmes « Construire des algorithmes publics exemplaires » et « Reset », la Fing espère pouvoir prolonger ces travaux, notamment sur le plan méthodologique grâce à des cas d’usages locaux. « C’est un peu comme lorsque l’on parlait de l’ouverture des données publiques il y a dix ans et que l’on expliquait l’importance de la transparence. Il en va de même avec les algorithmes : il y a une sorte de déni sur ce qui existe ou n’existe pas. »

Un déni dont il serait temps de sortir puisque les risques, eux, sont réels. En mai 2020, le Défenseur des droits a même tiré la sonnette d’alarme avec la Cnil, en rappelant que « le système algorithmique, neutre en apparence, peut produire des discriminations » et appelant à une « mobilisation collective ». Car, tout numérique qu’il soit, l’algorithme n’est, au final, que la retranscription de choix humains.

Trois questions à Jean-Philippe Clément, responsable de la démarche et des solutions data à la ville de Paris Quand avez-vous commencé à travailler sur la transparence des algorithmes publics ? Nous avons identifié le guide d’Etalab et les travaux de la Cnil sur le sujet, ainsi que l’obligation au 1er juillet 2020 d’arriver à recenser, mentionner et pouvoir expliquer l’usage des algorithmes, notamment concernant les décisions individuelles. La crise sanitaire et le confinement ont un peu chamboulé notre calendrier. Il reste compliqué pour une collectivité territoriale d’arriver à savoir où elle met les pieds vis-à-vis de la définition des algorithmes et, par exemple, de savoir quels traitements de données sont réellement concernés. Cette démarche est essentielle pour la transparence, aussi bien du côté de l’usager que de l’agent, mais la mise en œuvre n’est pas si simple. Quelles sont vos méthodes de travail pour identifier et recenser ces algorithmes ? Le confinement a, là aussi, bouleversé nos méthodes de travail, en particulier, vis-à-vis des démarches collectives que nous avions prévues de mettre en place. Nous avons décidé d’effectuer une sorte de prérepérage avec le délégué à la protection des données et la direction des systèmes d’information. Nous consulterons ensuite les directions nous semblant les plus concernées pour les intégrer à cette réflexion. Nous travaillerons également sur l’acculturation, car si les agents métiers ont conscience de ce qui se joue, il est important de montrer qu’un algorithme ne neutralise pas leur responsabilité, et de rappeler les dimensions éthiques des outils que l’on utilise. Quels types d’algorithme et de service sont concernés ? Ces questions sont actuellement en cours d’analyse, mais on peut penser, par exemple, à la pondération et au scoring, soit l’attribution de points par rapport à différentes caractéristiques en vue d’accéder à une prestation ou une demande en ligne. On peut, en outre, s’intéresser aux mécanismes de préinscription et, lorsque la ressource est limitée, à l’utilisation du tirage au sort, par exemple pour accéder à des loisirs ou des activités culturelles.