Quels enjeux pour une expérimentation du big data pour la politique de la ville ?

Parler de numérique quand on est un acteur de la politique de la ville, c’est aborder avec justesse les questions d’accès, d’usages, d’équipements, d’égalité et de justice mais rarement de data, de données d’intérêt général et d’exploitation de ces dernières.

Probablement parce que l’urgence est présente et qu’il nous faut éviter les décrochages mais aussi parce que ces sujets sont parfois complexes à appréhender et nécessitent une acculturation voire une démystification.

C’est dans cet esprit que RésO Villes a lancé en 2019 le programme « Data et quartiers », qui vise à doter les acteurs de la politique de la ville d’outils de compréhension et de mesure innovants inspirés de démarches nouvelles que l’on retrouve le plus souvent concentrées dans les quartiers centraux au titre de programme dits de « ville intelligente » avec la certitude que la culture de la donnée devaient infuser dans ces quartiers pour une meilleure efficacité des politiques publiques à l’œuvre.

Accompagné par l’ANCT, par des collectivités territoriales mais aussi par des partenaires privés comme la CNAM, le groupe Vyv, pôle emploi, Randstad et Civiteo, RésO Villes a lancé un programme expérimental de trois ans qui se donnait 3 grands objectifs.

Le premier objectif du programme est d’expérimenter des outils de type « datascience » pour mieux observer les quartiers « politique de la ville ». Les acteurs publics sont de plus en plus nombreux à utiliser des outils d’analyse et de calcul, d’ordinaire exploités dans la sphère privée, à des fins d’amélioration de l’action publique. L’interrogation était la suivante : si ces outils fonctionnent ailleurs, pourquoi ne pas les essayer aussi dans les quartiers ?

Un autre objectif du programme est de sensibiliser divers publics à l’utilisation de solutions de datascience à des fins d’intérêt général. C’est l’idée qui a présidé à la création du programme, à la définition des objectifs et aussi celle qui a permis de convaincre les principaux supporteurs du projet. Les acteurs publics ne sont pas encore familiers des outils de la datascience, qu’il s’agisse de la mise en œuvre d’algorithmes pour modéliser des données, voire même prédire des comportements ou des événements, ou encore du recours à la datavisualisation pour expliciter des données compliquées.

Un troisième objectif est d’offrir la possibilité de dupliquer les expérimentations mises en œuvre dans le cadre du programme. L’intégralité de la méthodologie d’expérimentation est documentée et sera rendue publique dans un livre blanc pour que les acteurs publics, les experts et les associations qui travaillent en lien avec les quartiers « politique de la ville » puissent reproduire ces travaux dans d’autres territoires. Notre leitmotiv pour réaliser cette étude est le suivant : plus encore que les résultats, ce sont les moyens d’y parvenir qui nous intéressent !

 

Les axes de travail

Trois thématiques ont été retenues pour être l’objet des expérimentations du programme « Data et quartiers » : « l’emploi dans les quartiers », « la santé et le cadre de vie des habitants des quartiers » et « la question de la mobilité dans les quartiers ». Ces trois thématiques correspondent à des enjeux majeurs, pour lesquels des analyses intégrant des données massives sont susceptibles d’améliorer la compréhension et la connaissance des acteurs publics tant sur la réalité du quotidien des habitants, que sur leurs besoins et leurs attentes. Elles ont été identifiées lors de la phase d’amorçage du projet, à l’issue d’une trentaine d’entretiens avec les membres du Conseil d’administration de RésO Villes et différents organismes qui travaillent sur les territoires des quartiers « politique de la ville ».

Le groupe de travail sur l’emploi s’est fixé comme objectif d’étudier la réalité de la distance entre les métiers recherchés par les habitants des quartiers « politique de la ville » et les emplois à pourvoir qui y correspondent. Ce travail est réalisé par les équipes de datascience du groupe Randstad. Les données utiles à la résolution de cette problématique ont été transmises par Pôle emploi. Il s’agit des données des métiers les plus recherchés par les habitants des quartiers, d’après les déclarations effectuées lors des premiers entretiens avec les agents de Pôle emploi. Bien sûr, ces données sont anonymes ! Elles ont ensuite été croisées avec les données des offres d’emploi à pourvoir, fournies par Randstad. Les cartographies produites, en lien avec les données Tom-Tom,  permettent de visualiser la distance entre les emplois les plus recherchés par les habitants des quartiers et la localisation des offres d’emploi.

Le groupe de travail sur la santé a réalisé une étude sur l’observation de la fragilité des quartiers à la Covid-19 et travaille sur la question du non-recours à la complémentaire santé solidaire (anciennement CMU-C) par les habitants des quartiers « politique de la ville ». Un partenariat majeur a été signé avec la CNAM et le groupe Vyv pour avoir accès aux données.

Les travaux du groupe « mobilité » s’est posé une question en lien avec le groupe emploi, quels sont les moyens de transports disponibles pour permettre aux habitants des QPV de se rendre sur leur lieu de travail ? Et combien de temps représentent ces trajets ?

 

Quelle est la méthode ?

Nous avons élaboré une méthodologie sous la forme d’un protocole d’expérimentation pour guider nos travaux.

La première étape est une étape de sensibilisation. Il est primordial au démarrage d’un projet de datascience de sensibiliser les acteurs qui vont participer à la démarche (on parle alors de « data mindset »).Un temps de travail préliminaire est donc utile pour expliquer les nouveaux usages qui peuvent être faits de la donnée par des acteurs publics et détailler les enjeux qu’ils posent : des enjeux techniques, mais aussi politiques, managériaux ou encore économiques.

La deuxième étape consiste à définir des objectifs.

Nos travaux débutent donc par une séquence de « brainstorming » durant laquelle les participants se fixent des objectifs, les plus précis possibles. On choisira par exemple de chercher à connaître le temps moyen de trajet entre le domicile et le lieu de travail des habitants des quartiers, plutôt que de travailler sur « l’amélioration de la connaissance des habitudes de déplacements des habitants ».

La troisième étape vise à choisir les données utiles à la réalisation du projet. Cet exercice dit de « datamining » est mené avec succès lorsque les participants ne se censurent pas et proposent des données y compris prétendues difficiles à obtenir, par exemple des données produites par des acteurs privés

La quatrième étape est celle du prototypage du travail d’analyse des données. Une fois les données choisies, il faut décider de la manière dont elles seront traitées, croisées ou analysées. C’est un moment décisif qui conditionnera la suite des travaux. Pour finaliser le prototypage, il convient aussi d’arrêter un format de restitution. Autrement dit, il faut s’accorder entre les partenaires sur le format du livrable.

La cinquième étape vise à accéder aux données. Pour réaliser les ambitions précédemment fixées, il faut réussir à mettre la main sur les données ciblées. Si ces données sont disponibles en « open data », c’est-à-dire publiées sur des sites internet dans des formats accessibles et réutilisables, alors cette étape est plutôt simple à franchir. Mais lorsque les données ne sont pas ouvertes il faut solliciter le partage auprès des acteurs qui les détiennent. Et cela peut s’avérer difficile. Les organisations publiques et privées n’ont pas encore toutes intégré une culture du partage de la donnée, y compris pour des projets conduits à des fins d’intérêt général. Publiques ou privées, les organisations sont encore frileuses et s’inquiètent des usages qui pourraient être faits de leurs données.

La sixième et dernière étape est celle de la réalisation de la datascience. La data science (en français « science des données »), c’est l’étape d’analyse et d’exploitation des données massives après leur collecte. Si la data science est un véritable enjeu pour les entreprises, elle le devient pour l’action publique. C’est une étape technique qui est pilotée par des spécialistes de la manipulation et du traitement de données, appelés des « datascientists ».

Cette expérimentation a été riche d’enseignement, RésO Villes a désormais la conviction que la question des données massives est cruciale dans l’observation et l’analyse des territoires, que l’accès à ces données est une question de transparence et d’égalité et que leur gestion annonce un changement majeur à venir dans les pratiques de pilotage des politiques sociales et urbaines et plus précisément dans la capacité des acteurs à porter un autre regard sur les quartiers dits prioritaires.

Une erreur est survenue lors de la récupération des informations de l'évènement