D.R.
Dans l’univers de la data, les données publiques tiennent une place de choix, après lesquelles courent la plupart des acteurs : géants du web «disrupteurs», startups, industriels «classiques», délégataires de services publics... L’appétit n’est sans doute nulle part aussi fort que dans le secteur des transports. Transdev vient d’annoncer le lancement de Catalogue, une plateforme open data à vocation mondiale des données de transports. Interview de Yann Leriche, directeur de la performance et du digital de Transdev.
Ma Gazette
Sélectionnez vos thèmes et créez votre newsletter personnalisée
Transports et numérique : vers une mobilité réinventée
Dans notre société numérique, l’accès aux datas, aux données, est devenu le nouveau graal de toute innovation. Et parmi les données, les données publiques tiennent une place de choix, après lesquelles courent la plupart des acteurs : géants du web «disrupteurs», startups, industriels «classiques», délégataires de services publics… Comme disent les économistes, la demande est forte, mais l’offre doit se structurer. Les données publiques ont donc beaucoup de valeur. Ce qui explique qu’elles aient fait l’objet, ces dernières années, de plusieurs lois pour réguler leurs conditions de publication, et de réutilisation.
L’appétit n’est sans doute nulle part aussi fort que dans le secteur des transports, ou plus largement des mobilités (à l’exception, peut-être, de la santé). Ce qui se comprend, vu la part de leur vie que passent les individus, dans le monde entier, à se déplacer, et souvent à perdre du temps. Or, les réseaux de transports, souvent publics, produisent des monceaux de données, aujourd’hui collectées mais peut exploitées. Les automobilistes produisent eux-aussi, via des applications sur smartphones, de précieuses données de circulation temps réel. Pour les acteurs des mobilités, l’enjeu, désormais, c’est bien de pouvoir agréger ces données, les croiser, pour produire de nouveaux services pour la ville. Il faut donc, non pas les posséder (la possession n’est pas nécessaire dans un univers numérique) mais y accéder.
La RATP vient d’annoncer mettre à disposition ses données temps réel sur Paris. Même le très décrié Uber propose, le 9 janvier de partager ses données avec les villes. De son côté, Transdev lance Catalogue, une plateforme qui ambitionne de devenir le « Wikipédia » de la donnée de transport. Pourquoi ? Comment ?
Yann Leriche, directeur de la performance et du digital de Transdev
Vous avez récemment lancé « Catalogue », présentée comme une plateforme opendata de la mobilité, à vocation internationale. Comment un transporteur comme Transdev en arrive-t-il à lancer une telle démarche ?
Yann Leriche : L’idée de Catalogue répond à notre vision de la mobilité du futur, qui doit permettre de prendre des parts de marché à la voiture particulière, à « l’autosolisme », ceux qui se déplacent seuls en voiture. Aujourd’hui, il y a d’un côté les modes individuels pour se déplacer (voiture, taxi), qui ont le mérite d’être souples et porte à porte. Ces modes sont dominants même s’ils sont assez chers pour se déplacer. De l’autre côté, il y a les transports publics, avec un avantage certains sur le prix pour les passagers, mais avec la contrainte qu’ils ne sont pas en porte-à-porte, et parfois moins rapides.
D’autres modes partagés, comme le covoiturage, « explosent » avec les trois révolutions du numérique, de l’économie du partage, et de l’abondance des financements à destination des startups dans le monde de la mobilité. Chacun de ces modes alternatifs à la voiture particulière ne peut, individuellement, prendre de part de marché significative à l’autosolisme. Ensemble ils le peuvent.
C’est pourquoi des opérateurs, des startups, et d’autres acteurs agrègent les données des différents modes de transport, pour les comparer et les combiner, ou pour, dans la logique des trips planners, analyser les meilleures manières d’aller d’un point A à un point B, avec toutes les options possibles, et donc en particulier celles en transports partagés. Les nouveaux acteurs sur ce secteur, c’est Google, Citymapper, Moovit, Transit… Transdev le fait avec des services comme Optymod à Lyon et Toronto.
Où vous situez-vous dans ce nouveau paysage de la mobilité ?
Un trip planner, c’est en réalité deux activités : un premier travail consiste à collecter, nettoyer et mettre au format la donnée. En France par exemple, avec la loi Macron, et plus largement l’ouverture des données publiques, de plus en plus de collectivités vont publier les données de transport. Mais il n’y a pas, pour l’heure, de normes indiquant comment il faut les ouvrir. Ce qui fait que les formats sont différents selon les réseaux ou les territoires, que la description des données peut varier d’un acteur à l’autre… Une fois que les données sont exploitées au bon format, elles sont traitées par des algorithmes qui vont calculer les temps de parcours les plus courts, les plus rapides…
Pour un acteur comme Transdev, cette fonction de récolte des données est une activité à part entière. Beaucoup d’acteurs le font, ça coûte relativement cher, et de plus en plus au fur et à mesure que le volume des données exploitées augmente. Nous souhaitons donc faire sauter les digues, et que chacun puisse exprimer sa créativité en inventant de nouveaux services, sans que la donnée de base, propre, au bon format et globale, constitue une barrière. Car c’est notamment sur cette partie du travail de la donnée que se fait la différence aujourd’hui, sur la capacité à mobiliser des fonds qui vont être utilisés pour la collecte et le traitement de l’information, dans les mêmes villes, sur les mêmes trajets…, et pas seulement sur l’innovation et la création de nouveaux services globaux, à même de constituer une alternative crédible à l’autosolisme.
Pour que le sujet ne soit qu’une course à la créativité et pas à l’argent, nous pensons que l’idéal serait que ces données de transports deviennent un commun, un bien public. Nous voulons que Catalogue devienne le « Wikipédia » de la donnée de transport.
Vous n’avez pas évoqué les acteurs comme Waze ou Tom Tom. Où les placez-vous ?
C’est vrai, vous avez raison. Pour le démarrage, nous commençons avec les « données théoriques », les arrêts et les horaires des transports publics. Mais très vite, nous prévoyons d’ouvrir les données temps réel. Dès que ces données seront proposées, alors nous espérons bien avoir des accords avec ces acteurs dont vous venez de parler pour qu’ils fournissent les leurs.
L’objectif c’est, en commençant par le transport public, d’aller vers la mobilité en intégrant le plus de données possibles. Les données publiques sont les plus simples à avoir, car, financées par de l’argent public, les gouvernements n’ont pas trop de mal à décider qu’elles appartiennent à tout le monde. Les données des opérateurs privés, c’est évidemment un autre sujet, mais nous comptons bien que Catalogue soit le lieu unique pour accéder à l’ensemble des données de mobilité.
Comment comptez-vous convaincre les acteurs privés de rejoindre Catalogue ? Des travaux précédents avaient imaginé une régie de données…
Nous sommes bien dans cette logique. Tout n’est pas encore définitif. Mais si on parle du transport public, et qu’on envisage les données publiées par certaines villes, il n’y aura pas d’obstacle particulier pour accéder à ces données publiées dans Catalogue. Tous les acteurs, les développeurs, les startups…, seront intéressés par le fait de les trouver au même endroit. Une des premières questions qui se pose est : comment inviter les agglomérations en France et à l’étranger à mettre leurs données sur Catalogue ? Nous allons pour cela fournir quelques fonctionnalités très simples, pour que quelqu’un qui n’est pas un professionnel de la donnée puisse publier les siennes, même si ce sont des pdf, à charge pour Catalogue, notamment, de les transformer au bon format et d’ouvrir des API. Nous prévoyons aussi de vérifier automatiquement que les données publiées sont cohérentes, par exemple que le temps de route d’un bus entre deux arrêts soit compatible avec la réalité de la voirie localement.
Pour les autres acteurs, privés notamment, il faudra que nous soyons capables de fournir des services, ou proposer des « trocs » : vous nous confiez toutes vos données, dont l’accès est gratuit pour tous ceux qui les utilisent de manière « raisonnable », mais elles peuvent devenir payantes pour les très gros utilisateurs de données. Ce qui permettrait, par ailleurs, de financer la plateforme, car nous aurons besoin de serveurs importants. Mais nous n’en sommes pas là.
Quid des autres transporteurs publics, type SNCF ou RATP ?
Nous ferons tout pour que nos concurrents directs joignent Catalogue. C’est pour cela que nous l’envisageons comme un commun, et que nous l’avons placé au sein de la Fabrique des mobilités. Nous ne voulons pas que la gouvernance soit pilotée par Transdev ; nous n’en serons qu’un des fournisseurs, et qu’un des utilisateurs. Si nous le finançons pour le démarrage, il a vocation à être à l’équilibre, avec de nouveaux intervenants qui viendront le piloter, avec nous. Nous n’avons pas vocation à en être le seul animateur.
Mais j’entends les réticences de certains transporteurs en position de monopole, même si je ne les partage pas, qui craignent qu’en ouvrant leurs données de tarifs des billets par exemple, alors il devient possible, pour d’autres, de reconstituer la façon dont ils font du yield management sur un service qu’ils sont les seuls à offrir. Sur ce point nous sommes dans une position différente, car notre cas, on applique les tarifs demandés par nos AOT.
Vous positionnez Catalogue à l’échelle mondiale. Quelle est l’état de l’ouverture des données de transport ailleurs ?
En Angleterre, comme en Allemagne, c’est très ouvert ; plus qu’en France. Aux Etats-Unis, c’est assez ouvert. D’ailleurs, les deux premières villes présentes sur Catalogue seront New York et San Francisco. Ce que nous voulons, c’est rassembler très rapidement le plus possible de gens autour de ce projet.
Pourquoi n’utilisez-vous pas data.gouv.fr, la plateforme animée par la mission Etalab ?
Il n’y a pas de data.gouv.fr pour la donnée de transit aujourd’hui. Il est d’ailleurs question d’utiliser Catalogue pour cela, qui permettrait de publier les données au bon format, nous discutons avec l’Etat.
Certains opérateurs de service public s’opposent au mouvement d’open data au motif que la publication des données trahirait des secrets industriels. Vous ne partagez donc pas ce point de vue ?
Non, car je suis convaincu que les données de transport, y compris en temps réel, doivent être fournies et partagées gratuitement. D’abord parce que, je ne vois pas l’argument de sécurité invoqué par d’autres acteurs. Ensuite pour la simple et bonne raison que si on ne les ouvre pas, elles pourront être reconstituées : les horaires au poteau peuvent être récupérés, même si c’est fastidieux. S’agissant des données temps réel, ce n’est pas insurmontable de les reconstituer, notamment par crowdsourcing. Donc il vaut mieux le faire nous-mêmes, proprement, et de manière fiable pour nos clients.
En revanche, je ne vois pas la nécessité d’ouvrir certaines données de fonctionnement interne. Si on parle de la maintenance des véhicules, par exemple, on touche effectivement à un savoir-faire propre à l’entreprise, constitutif de sa compétitivité. Pour résumer, à mon avis, doit être ouvert tout ce qui concerne l’expérience utilisateur.
Le cadre réglementaire vous convient donc ?
La loi Macron nous allait bien. Dans la loi Lemaire, on ne sait pas où s’arrête l’obligation d’ouverture. Est-ce qu’on sera protégé par le secret des affaires sur les méthodes de maintenance dont je parlais ? Nos conseils nous disent que ce n’est pas clair, à l’heure actuelle.
L’important, pour demain, c’est la « couche » de services et d’innovation, qui est notre deuxième métier. Nous ne sommes pas assez présents sur tous les modes pour prétendre offrir à nos clients un service global de transport effectué dans nos véhicules. D’où la proposition d’ouvrir les données qui permettent d’agréger les différents modes et d’offrir des services globaux de mobilité, s’appuyant sur plusieurs opérateurs. Nous ouvrons nos données stratégiques, et nous demandons la réciproque aux autres pour pouvoir proposer des services complets à nos clients.
Nous pensons que notre différence se fera sur les algorithmes, qui sont notre point fort, car nous opérons différents modes de transports réguliers et à la demande dans de nombreux pays. Optymod à Lyon ou Triplinx à Toronto sont les seuls services au monde qui agrègent tous les modes de transport, y compris routiers.
Vous ne craignez pas l’ubérisation ?
Effectivement, le risque existe. Mais nous ne croyons pas que pour résister il faille créer une digue en fermant l’accès aux données par exemple. Au contraire, il faut courir plus vite que les autres pour offrir le meilleur service. Les gens qui se déplacent ont besoin de transport public, mais aussi de transports alternatifs, d’autres solutions. Si nous ne bougions pas, nous ne perdrions pas immédiatement nos délégations de transports publics, mais nous perdrions nos clients, qui se déplaceraient sans nous utiliser.
Quel format privilégiez-vous ?
Nous avons notre propre standard, mais pour Catalogue, nous avons choisi un format ouvert, le GTFS, créé pour la donnée de transport. C’est le plus utilisé dans le monde.
Sous quelle licence seront publiées les données sur Catalogue ?
Tout n’est pas définitivement tranché, mais à ce stade, les licences seront celles que choisissent les fournisseurs de données. Il y a aujourd’hui beaucoup de type de licences, ce qui rend les choses compliquées, et nous place dans l’incertitude. Je suis persuadé qu’elles vont finir par converger vers un ou deux modèles, et que les villes, notamment, se concentreront sur ce ou ces modèles.
Qui doit ouvrir les données, le transporteur ou l’Autorité organisatrice de transport (AOT) ?
La loi Macron dit que c’est le transporteur, ou, le cas échéant, l’AOT. L’expression « le cas échéant » n’est pas la plus appropriée pour définir une ligne claire, d’autant que le décret n’est pas sorti. En pratique, cela dépend de la nature des données dont on parle. Les données des horaires ou des arrêts peuvent être publiées par l’AOT. C’est différent des données temps réel, qui viennent du système du transporteur.
Membre du comité exécutif et Directeur de la performance depuis le 1er janvier 2014, Yann Leriche est en charge de l’excellence opérationnelle & commerciale, ainsi que du numérique pour le groupe Transdev.
Bio Express
Diplômé de l’Ecole Polytechnique (1997), de l’Ecole des Ponts et Chaussées (2000), du Collège des Ingénieur (2000) et de l’ESCP-Europe (2006), Yann Leriche commence sa carrière dans le secteur public (DDE du Calvados puis Reims Métropole) avant de rejoindre Bombardier Transport.
Il entre dans le groupe Transdev en 2008 et y occupe successivement les postes de Directeur général de Transamo, directeur de Transdev SZ GmbH (Allemagne), directeur adjoint des opérations Amérique du Nord, directeur de la Performance.