Les données, une ressource incontournable pour la connaissance du territoire
Avec l’accélération de la numérisation de l’économie et de la société, de plus en plus de données sont produites dans les territoires. Elles concernent tous les secteurs de l’économie et toutes les compétences des collectivités : de l’éclairage public à l’arrosage automatique, des services scolaires à l’eau potable, de la vidéoprotection au transport…
Ces données proviennent de sources variées et sont produites par une multitude d’acteurs, à titre d’exemple :
- Le système d’information de la collectivité : de nombreuses données sont collectées par les services métiers et supports de la collectivité. On pense en premier lieu aux importantes banques de données gérées par le système d’information géographique,
- Les objets connectés : les capteurs déployés sur le territoire transmettent à la collectivité des données sur la consommation d’eau, le niveau de remplissage d’une benne à ordure, le niveau de luminosité d’une rue…
- Les autres acteurs publics : à titre d’exemple, les services déconcentrés et agences de l’Etat, les services départementaux d’incendie et de secours, les services de police et gendarmerie,
- Les acteurs privés présents sur le territoire : qu’il s’agisse d’entreprises ayant un lien direct avec la collectivité (titulaires de marchés publics par exemple) ou indirect (sociétés collectant des données sans lien contractuel avec la collectivité, Waze par exemple). Il peut s’agir également des associations,
- Des citoyens : via les informations transmises aux différentes administrations (services scolaires, état civil…), les relevés GPS…
Ces données, de plus en plus abondantes, représentent une source d’information importante et, pour certaines, incontournable pour la bonne connaissance des territoires. Cependant, pour que ces données puissent être collectées et utilisées, des règles de gestion précises et rigoureuses doivent être mises en place, dans le respect de la réglementation, avec l’accord des différentes parties prenantes et sous le contrôle démocratique.
La maitrise des données, un enjeu majeur pour les collectivités
Ces données, par la connaissance du territoire qu’elles apportent, constituent un formidable levier pour le pilotage des politiques publiques locales. Elles facilitent notamment l’établissement de diagnostics, la mise en place d’outils d’aide à la décision et le développement de nouveaux services aux citoyens.
Pour disposer de la pleine maitrise de ces données, il est essentiel pour la collectivité de s’approprier ce que l’on appelle la chaine de valeur de la donnée qui décrit, sous la forme de couches, les principales actions à suivre. Elle est présentée par le schéma ci-dessous.
Les données collectées auprès des différentes sources sont envoyées dans une plateforme de données via des connecteurs, que l’on désigne souvent par l’acronyme API pour Application Programming Interface.
La plateforme correspond à la couche technique de la chaine de valeur. Elle centralise les données reçues. Elle les analyse, éventuellement les corrige et les stocke dans une base de données. Lorsque le volume de données collectées est très important (on parle alors de big data), ces dernières peuvent être stockées dans un lac de données (data lake) afin d’en faciliter l’extraction et l’exploitation par des algorithmes spécifiques de traitement massif de données.
Enfin, les données vont être extraites de la plateforme pour alimenter plusieurs cas d’usage, à titre d’exemple :
- La visualisation : Elles peuvent être utilisées par un service métier pour le pilotage d’une compétence particulière. A titre d’exemple, il peut s’agir de données issues de capteurs de stationnement, de capteurs installés sur la voirie pour mesurer le trafic, de capteurs énergétiques dans les bâtiments publics…
- La publication : les données peuvent être publiées sur un portail open data par exemple,
- La transmission : les données peuvent être mises à disposition d’un tiers pour une utilisation spécifique, par exemple une startup souhaitant développer un nouveau service innovant à destination des collectivités,
- Le reporting : les données peuvent alimenter un tableau de bord à destination des décideurs,
- Le traitement automatisé : les données peuvent être extraites de la plateforme pour, une fois analysées, engager une action automatique. A titre d’exemple, on peut citer l’arrosage automatique qui peut se déclencher/s’arrêter en fonction du taux d’humidité des sols,
- L’analyse spécifique, notamment via un algorithme faisant appel à l’intelligence artificielle : il s’agit ici d’une étape intermédiaire, les données extraites subiront un traitement particulier permettant de leur donner du sens avant d’alimenter un des cas d’usage présentés ci-dessus.
Cette présentation schématique de la chaine de valeur permet d’exposer, de manière conceptuelle, toutes les étapes nécessaires pour une bonne utilisation des données. Sa mise en place concrète dans une collectivité nécessite naturellement de l’adapter afin de prendre en compte l’existant et les ambitions de celle-ci.
La gestion des données, un sujet complexe et pluridisciplinaire
Au-delà des outils informatiques dont la nécessité ne fait pas de doute, la gestion des données et la bonne maitrise de la chaine de valeur de la donnée embarquent de nombreux autres sujets :
- Juridique : la collectivité doit respecter en premier lieu la réglementation (RGPD, loi pour une République numérique…) qui encadre l’utilisation des données ;
- Contractuel : les contrats signés avec des acteurs privés – notamment dans le cas de marchés publics ou de délégations de service public – doivent intégrer des clauses data de manière à ce que la collectivité puisse exiger du partenaire privé la transmission des données utiles pour le pilotage du service ;
- Technique : la gestion des données embarque de nombreuses questions techniques comme la compatibilité des nouveaux outils avec l’existant, l’adaptation des systèmes d’information de la collectivité, l’interopérabilité des données, l’hébergement des données…
- Sécurité informatique : l’utilisation massive de données peut entrainer une vulnérabilité des systèmes à laquelle il convient d’être très vigilant. Des collectivités ont déjà été victimes de cyberattaques de la part d’acteurs malveillants ;
- Organisationnel : la mise en place d’une gestion des données nécessite le recrutement de personnes disposant de compétences pointues, la désignation d’un élu en charge du sujet et, dans la mesure du possible, une transformation de l’organisation en laissant une place plus grande à la transversalité ;
- Financier : les coûts du déploiement, exploitation et maintenance des solutions peuvent être importants. Ils doivent donc être chiffrés le plus précisément possible et budgétairement programmés dans le temps ;
- Environnemental : le fait de produire, transférer et stocker de plus en plus de données n’est pas sans conséquences environnementales (production de chaleur des serveurs notamment). De plus en plus de projets data prennent d’ailleurs en compte cette problématique de sobriété.
Ainsi, la bonne gestion des données nécessite la mise en place d’une stratégie et d’une gouvernance qui vont définir la manière dont la collectivité va utiliser les données pour l’exercice de ses missions.
Les étapes clefs de la construction d’une stratégie de la donnée
Il n’existe pas aujourd’hui un cadre prédéfini pour bâtir une stratégie de la donnée. Cette dernière dépend notamment de l’existant et des ambitions de la collectivité en matière d’utilisation des données.
Toutefois, les premières initiatives lancées permettent d’identifier quelques étapes-clés. Plus que de vrais jalons à respecter scrupuleusement, ces étapes balisent davantage un ensemble de questions qu’il est nécessaire de se poser pour mettre en place une stratégie.
Source : Guide Gestion des données : Quels outils et quelle stratégie pour les territoires – Banque des Territoires (décembre 2020)
On peut ainsi distinguer :
- Phase de diagnostic, se poser les bonnes questions : il s’agit ici de faire un état de lieu de l’existant (outils techniques, compétences, situation financière…) et définir les ambitions afin l’élaborer un plan d’actions présentant le couple objectifs/moyens le plus optimal ;
- Ouvrir ses données : si l’ouverture des données est une obligation pour les collectivités de plus de 3 500 habitants, cette étape est également une excellente occasion d’analyser la manière dont la donnée est traitée au sein de la collectivité. En ce sens, elle participe, par une application concrète, à la phase de diagnostic ;
- Être en conformité avec le RGPD : la conformité à la réglementation est à la fois un point de départ (aucun projet data ne peut être lancé sans être conforme à la réglementation), mais cette disposition doit naturellement se prolonger tout au long du déroulement du plan d’actions de la collectivité ;
- Construire la fonction data : la gestion des données nécessite des compétences spécifiques articulées autour d’une fonction data transverse aux directions métiers de la collectivité, qu’il convient de mettre en place pour s’assurer une gestion sécurisée et efficiente de la donnée ;
- Se doter d’une doctrine/gouvernance : il s’agit de définir l’ensemble des règles permettant un bon usage des données au sein de la collectivité. Cette réflexion doit balayer tous les sujets embarqués dans la gestion des données, présentés ci-dessus ;
- Faire des choix techniques : datalake ou entrepôt de donnée, SaaS ou on premise, hébergement des données local ou externalisé, API génériques vs API propriétaires, open source ou formats propriétaires… Les questions techniques sont nombreuses et importantes. Il n’y a pas une seule et unique bonne réponse. Les choix dépendent des contraintes liées à l’existant et de la feuille de route décidée par la collectivité ;
- Passer du prototype à l’échelle : le déploiement à l’ensemble de la collectivité d’un prototype développé localement avec un nombre limité de fonctionnalités et d’utilisateurs doit faire l’objet d’une attention particulière. En effet, une telle mise en œuvre nécessite de vérifier au préalable que le système supporte une charge d’utilisation croissante (« scalabilité »). On peut citer, à titre d’exemple, un prototype qui serait développé, dans un souci de simplification et de maitrise des coûts, à partir d’une base de données statique (non actualisée) et qui serait, une fois déployé à grande échelle, adossé à une base de données dynamique actualisée en temps réel, nécessitant ainsi de nouveaux développements ;
- Animer la gestion des données du territoire : la gestion des données du territoires ne se limite pas nécessairement aux données de la seule collectivité. Pour être en mesure d’utiliser un champ large d’information, il peut être intéressant d’intégrer dans le dispositif, tous les acteurs du territoire (entreprises, associations, établissements d’enseignement, citoyens…) ;
- Formaliser et diffuser la stratégie : la mise en place d’une stratégie de la donnée peut être l’occasion d’affirmer des choix politiques forts qui peuvent être matérialisés de plusieurs manières (délibération, charte…).
Pour en savoir plus
Au terme d’une étude d’envergure qu’elle a menée auprès de nombreux acteurs publics et privés de l’écosystème de la gestion de la données, la Banque des Territoires va publier une boite à outils à destination des territoires.
Cette dernière contient :
- Un guide à destination des décideurs locaux balayant tous les principaux sujets relatifs à la gestion de la donnée,
- Un guide des bonnes pratiques contractuelles qui propose des rédactions de clauses data permettant d’avoir une pleine maitrise des données produites et gérées par un acteur privé dans le cadre d’un contrat,
- Une cartographie des ensembles de données qui récence et classe par thème les jeux de données produites et publiées par les collectivités.