L’exemple de la modélisation des parcours des bénéficiaires du RSA
L’expérimentation conduite par la société CIVITEO pour le compte du Département du Finistère témoigne parfaitement de la possibilité d’applications « sociales » du big data.
La société CIVITEO, qui s’intéresse à la place de la donnée dans la décision publique, a proposé à l’un de ses clients une expérimentation autour de la modélisation des parcours des bénéficiaires du RSA. La problématique posée au départ de cette expérimentation était la suivante : peut-on identifier des zones de non-recours au RSA grâce aux outils de type big data ?
Pour ce faire, le Département du Finistère a mis à disposition de CIVITEO ses données sur l’ensemble des bénéficiaires du RSA depuis cinq ans. Ce fichier a été rigoureusement anonymisé dans le cadre d’un protocole conforme aux recommandations de la CNIL. Pour traiter ce fichier volumineux, le Département a fait appel à une startup de « datascience ».
Grâce à un algorithme puissant, cette start-up a croisé les données du RSA avec une quarantaine d’indicateurs socio-démographiques et économiques de l’INSEE (catégories socioprofessionnelles, logement, revenu mais aussi niveau de diplôme du chef de famille ou encore structure et composition familiale) disponibles au niveau des IRIS (unité statistique de base d’environ 2000 habitants).
Ces croisements ont permis de faire émerger de nombreux facteurs explicatifs sur le nombre de bénéficiaires du RSA. Mais c’est grâce à l’étape suivante que l’on peut parler véritablement de « big data ». En effet, la startup de « datascience » a agrégé toutes les analyses précédentes pour constituer une « modélisation ». C’est la force du big data : plus on ajoute des variables, mieux on explique le phénomène. Cela permet ensuite de construire une modélisation et parfois d’en déduire des modèles prédictifs.
Ainsi, l’expérimentation a permis d’identifier des zones de non-recours au RSA, c’est-à-dire des zones dans lesquelles il y avait moins de bénéficiaires du RSA que ce qui était prédit par le modèle. Ce qui a été fait à l’échelle des IRIS peut évidemment être rapporté à l’échelle des quartiers. Résultats cartographiques : Sur cette carte figurent en rouge foncé les IRIS dans lesquels il y a moins de bénéficiaires du RSA qu’attendus (donc un plus fort taux possible de non-recours).
AVERTISSEMENT : Cette modélisation a été réalisée dans le cadre d’un prototype visant à expliquer la démarche « Big data » appliquée à l’action sociale. Cette carte ne traduit pas la réalité du « non-recours au RSA » dans le Finistère en 2018.
Repères
Collectivité locale
Lieu : Finistère
Thème : Données sociales, Big data, Open data, algorithmes Action : analyse des données sociales
Contact : Dominique SOULIER – Directeur général des services du Conseil départemental du Finistère