DONNÉES & TERRITOIRES

S’appuyer sur la standardisation des données pour mieux connaître l’offre de médiation numérique

En 2017, la Mission Société Numérique publiait des données inédites sur les difficultés que rencontrent les Français face au numérique. Ce travail a permis de mettre la lumière sur l’inclusion numérique et de développer plusieurs programmes nationaux pour la filière dont la création de hubs territoriaux pour un numérique inclusif en 2019, têtes de réseau des acteurs de la médiation numérique en région. Interlocuteurs privilégiés des collectivités territoriales, des opérateurs de services publics et des entreprises privées du secteur participent à leur échelle au recensement de l’offre de médiation numérique.

Dans ce cadre, les hubs ont produit de nombreuses données de recensement des lieux et des offres de médiation, multipliant ainsi les bases de données comme la production de cartographies à destination de l’ensemble des acteurs de la médiation numérique. Pourtant aucune de ces productions ne respectent le même format rendant alors impossible une vision formalisée, complète et partagée de l’offre nationale de médiation numérique. Plus grave, la discontinuité dans ces formats de données crée aussi une discontinuité territoriale. Un habitant d’Aix-en-Provence recherchant une formation à l’usage des réseaux sociaux ne dispose pas du même niveau d’information qu’un habitant de Saint-Quentin.

L’exploration Données et Territoires de NEC 2021 visait à comprendre cette situation et à identifier les conditions de succès d’un standard des données de l’offre de médiation numérique en France.

Une exploration menée par la La MedNum et Datactivist.

 
 
Télécharger le compte rendu de l’exploration en PDF

La standardisation : une solution pour fédérer les données territoriales ?


Depuis le 7 octobre 2018, l’ouverture des données est devenue la règle pour les acteurs du service public, disposant de plus de 50 agents et pour les territoires de plus de 3500 habitants. L’Observatoire Open Data des Territoires porté par Open Data France montre de fortes disparités entre les territoires : 59,2% des communes et EPCI de plus de 100 000 habitants ont enclenché une démarche d’open data alors que ce chiffre tombe à 8,7% pour les EPCI de moins de 100 000 habitants et à 8,4% pour les communes entre 3500 habitants et 100 000 habitants. Sans compter que les fichiers ne contiennent pas les mêmes champs ou niveau de détail. Les valeurs dans les champs eux-mêmes ne sont pas normalisées. Concrètement, ces enjeux limitent l’impact des données ouvertes. Sans harmonisation des pratiques, il est très compliqué de construire des services ou des usages qui dépassent un seul territoire.

Pour répondre à un enjeu national, la standardisation des données facilite la découverte de données similaires ouvertes au sein de différents territoires en consolidant les données produites localement dans une base nationale. Les standards, en tant qu’ensemble de recommandations préconisé par un groupe d’utilisateurs, permettent à différents outils numériques de communiquer pour construire un ensemble cohérent au service d’un ou plusieurs objectifs.

Au niveau international, le standard pour les données liées aux réseaux de transport public, le GTFS (pour General Transit Feed Specification) par exemple, développé initialement par Google à partir de 2005 s’est imposé comme le standard dans le domaine et de nombreux usages ont été bâtis autour.

En France, depuis 2018, l’association Open Data France développe le Socle Commun des Données Locales (SCDL) pour homogénéiser la publication en open data de données essentielles produites par des acteurs territoriaux, aider les producteurs à améliorer la qualité des données qu’ils publient et faciliter l’exploitation des données publiées par les ré-utilisateurs.

Le SCDL a donné lieu à la création de Validata, un outil qui certifie la conformité d’un jeu de données à un standard. Validata et le SCDL ont aussi impulsé une dynamique dans l’administration d’État avec le lancement en juin 2019 de schema.data.gouv.fr, une initiative de la DINUM qui référence les standards pour la France qui ont été adoptés par voie réglementaire ou potentiellement utilisés par un grand nombre d’usagers. Le site référence également des schémas en cours d’investigation et de construction.

Ces initiatives s’inscrivent dans le contexte d’une impulsion politique favorable à la standardisation. La recommandation n°24 du rapport sur la politique de la donnée remis par le député Bothorel le 23 décembre 2020 définit une politique interministérielle d’interopérabilité et de qualité de la donnée insistant sur l’importance des démarches de standardisation.

L’ANALYSE DE L’EXISTANT

Analyse du potentiel du standard d’Aidants connect et des principales sources de données existantes sur l’offre de médiation numérique, en France.

Retrouvez l’analyse de l’existant produite lors de l’atelier

Le schéma des lieux d’inclusion numérique

En 2020, Aidants connect (une startup d’État de l’Incubateur des Territoires de l’ANCT) produisait un référentiel national des lieux d’inclusion numérique avec l’aide d’aidants et certains Hubs. Le schéma, disponible sur schéma.data.gouv, permet de modéliser les lieux d’accès au numérique sur tout le territoire français.
Il avait vocation à alimenter un projet de cartographie national des lieux d’inclusion numérique désormais abandonné. Le schéma est composé de 33 champs dont 2 obligatoires (“nom” et “en_ligne”).

Force est de constater que malgré la qualité du schéma et le travail produit, le standard n’est aujourd’hui pas utilisé par les acteurs de la médiation numérique. En effet, seule la ville d’Antibes a ouvert un jeu de données respectant ce schéma sur data.gouv. De plus, il ne référence qu’un seul lieu d’inclusion numérique. La non-utilisation de ce standard peut s’expliquer de plusieurs manières :

➔ Beaucoup de participants ignoraient l’existence de ce schéma ;

➔ Plusieurs cartographies des hubs ont été produites avant la construction du schéma ;

➔ Le schéma nécessite d’être amélioré pour s’adapter davantage aux usages locaux des données ;

➔ Les données respectant ce schéma sont trop complexes à produire pour les acteurs de la médiation numérique.

Les données disponibles de l’offre de médiation

En s’appuyant sur les travaux de recensement des cartographies des lieux de médiation de la MedNum, nous avons sélectionné 2 cartographies nationales, (APTIC, les bons clics de We Tech Care) et 4 cartographies territoriales produites par les hubs (Les assembleurs, Hinaura, RhinOcc, Conumm  au regard des critères suivants : diversité de territoire, d’approche, de format de données et d’exhaustivité. Ensuite, nous avons identifié les principaux champs communs aux données de ces cartographiesen enlevant les champs qui faisaient déjà l’objet de standardisation. Ainsi les participants ont analysé ces champs dans chacune des cartographies pour pointer des divergences ou convergences sur les données.
Sur la base de cette analyse, des recommandations pour un futur standard ont été formulées:

TARIF / Malgré quelques divergences (valeurs parfois différentes, le champ est libre sur certains portails mais défini dans d’autres, optionnel ou obligatoire), les participants se sont accordés sur la simplicité à standardiser ce champ. En effet, les valeurs employées dans les données sont les mêmes (gratuit/payant), les données sont toutes sous la forme de chaînes de caractères.

MODALITÉ D’ACCOMPAGNEMENT / La standardisation de ce champ nécessite une redéfinition de ce qu’il recouvre, puisque certains portails incluent uniquement la formation, tandis que d’autres proposent de l’accompagnement et de la formation.

ACCESSIBILITÉ / Les participants ont soulevé un problème de granularité des données des portails, avec un mélange des types de publics et un manque d’uniformisation. L’accessibilité et les valeurs qu’elle recouvre doivent être redéfinies.

MODALITÉ D’ACCÈS / Ce champ est relativement facile à standardiser puisque les portails emploient des valeurs similaires : accès libre, sur inscription, sur adhésion. Les types de données peuvent varier (données en nombre, en chaîne de caractère, géo) et la liste est tantôt libre, tantôt prédéfinie. Ces éléments sont aisément uniformisables.

PUBLIC CIBLE / Les participants recommandent de redéfinir l’étendue du champ et préconisent de limiter le nombre de valeurs à proposer.

STATUT / Ce champ converge quant aux valeurs proposées (public/privé), au type de données (chaînes de caractères) et à la liste de données (prédéfinies). L’intérêt d’aller en détail dans la description des statuts est questionné par les participants.

SERVICE / Les divergences du champ des services sont nombreuses. Il existe de 10 à 100 valeurs selon les portails, avec des listes de valeurs libres ou prédéfinies, et des services de nature très différentes.

APPRÉHENDER LES USAGES

Lors de cette exploration, nous avons également créé cinq personas d’usagers de données de médiation numérique. Ces personnages imaginaires représentent un groupe cible dans le cadre du développement d’un nouveau produit ou service.

Retrouvez les documents produits lors de l’atelier

Muriel, travailleuse sociale

Murielle accompagne un public socialement en nécessité et souvent en difficulté avec le numérique. Elle est confrontée quotidiennement à la fracture numérique et la dématérialisation de l’action publique n’arrange rien. Murielle n’a pas les compétences pour former les usagers du centre social au numérique, mais elle peut les orienter vers d’autres acteurs spécialisés.

Ses besoins :
➔ Connaître l’offre (structures et formations) de médiation numérique de son territoire ;
➔ Orienter simplement et efficacement les personnes qu’elle accompagne vers de structures de médiation numérique proches;
➔ Pouvoir prendre rendez-vous en direct avec la personne accompagnée auprès d’une structure de médiation numérique pour activer son parcours d’accompagnement numérique.

Conditions d’usage des données :
➔ Des données essentielles pour ne pas être noyée dans l’information ;
➔ Un outil de consultation des données facile à utiliser et gratuit.

Sophie, médiatrice numérique


Sophie est médiatrice numérique pour un EPCI dans un secteur rural.
Elle est itinérante et dispense ses formations dans plusieurs lieux et fait partie d’un réseau de médiateurs sur le département avec des membres qui échangent régulièrement en ligne.

Ses besoins :
Étoffer son réseau de lieux de médiation et de médiateurs pour orienter les publics lorsqu’elle ne peut pas dispenser les formations adéquates ;
Identifier et connaître les prescripteurs d’accompagnement numérique ;
Pouvoir facilement mettre à jour ses propres données sur les formations qu’elle propose.

Conditions d’usage des données :
Des données à jour ! C’est aujourd’hui rarement le cas ;
Avoir la possibilité d’imprimer les données ;
Un outil de consultation des données simple d’utilisation pour ne pas perdre de temps (front et back office).

Luc, artisan


Luc est artisan et n’est pas très à l’aise avec le numérique. Pourtant, il doit être autonome dans les démarches administratives de sa TPE.
Il aimerait également que son entreprise soit plus visible en ligne avec de la communication digitale. Aujourd’hui c’est son fils et des amis qui l’assistent dans ses démarches numériques professionnelles.

Ses besoins :
➔ Trouver un lieu de médiation numérique ouvert après sa journée de travail;
➔ Devenir autonome pour ses démarches administratives en ligne et développer sa communication digitale;
➔ Identifier un lieu facile d’accès avec une imprimante.

Condition d’usage des données :
➔ Avoir connaissance d’une cartographie des lieux de médiation numérique;
➔ Des données essentielles : localisation, horaires et formations proposées.

 

Alexandre, Directeur Général Adjoint à l’Action Sociale au sein d’une collectivité territoriale

Alexandre est cadre dans une collectivité territoriale et a en charge l’action sociale. Concrètement, il doit mettre en œuvre la vision politique de ses élus et aider ses derniers à prendre des décisions. Il est contraint par des réalités budgétaires et temporelles.

Ses besoins :
➔ Outiller ses agents pour faciliter l’orientation des publics;
➔ Rendre lisible l’offre de médiation numérique de son territoire pour améliorer le pilotage de l’action sociale de sa collectivité.

Condition d’usage des données :
➔ Pas trop de données. Alexandre souhaite avoir des données lisibles et simples à utiliser.

Marc, business developer dans une entreprise privée de services numériques

Marc, après une école de commerce, travaille dans une entreprise de services numériques. Concrètement, il est responsable de la commercialisation de services et produits que pourraient utiliser des lieux de médiation numérique. Il souhaite démarcher facilement ses lieux.

Ses besoins :
➔ Compléter son fichier de prospection;
➔ Avoir accès aux contacts des responsables des lieux et des prescripteurs pour pousser son produit.

Condition d’usage des données :
➔ Des données mises à jour et gratuites.

LA SYNTHÈSE DE CETTE EXPLORATION

Retrouvez la synthèse produite lors de l’atelier

 

Que retenir ?

On ne part pas de rien.
Il existe déjà un schéma des lieux d’inclusion numérique produit par Aidants Connects. Bien que peu ou pas utilisé aujourd’hui par les hubs territoriaux, le schéma correspond dans son ensemble aux besoins recensés lors de l’exploration. Ne réinventons pas la roue et appuyons nous sur ce travail et sur la communauté se mobilisant sur l’amélioration du schéma.

Il faut penser léger.
L’un des principaux freins à l’appropriation d’un schéma réside dans sa complexité et son niveau de détail (nombre de champs, nombre de valeurs, etc.). En plus de décourager les producteurs de données à l’utiliser, un schéma de données trop complexe empêche les territoires à se l’approprier complètement et à l’enrichir avec des spécificités territoriales (labels, services spécifiques, etc.). Les participants de l’exploration préconisent un schéma simplifié.

Toujours garder en tête les besoins finaux.
Les concepteurs d’un schéma de données sont assez rarement les producteurs primaires des données et les usagers des services produits à partir de ces données. Une participante de l’exploration, médiatrice numérique, rappelait à juste titre qu’elle imprimait les cartographies et quelques données avant d’orienter des bénéficiaires.

La standardisation des données, ce n’est pas un sujet de geek.
Plusieurs participants à l’exploration, non-experts des données, ont sérieusement envisagé de changer d’atelier en prenant connaissance du programme centré principalement sur la standardisation mais sont finalement restés, ouf ! La standardisation des données peut faire peur, mais il s’agit en réalité de ne répondre qu’à deux questions : quels sont les principaux usages de ces données ? Les formats de données existantes correspondent-ils à ces usages ?

La standardisation d’un jeu de données prend du temps.
Même si le sujet est plus simple qu’il n’y paraît, il nécessite du temps car un schéma réussi est un schéma construit collectivement avec les principaux usagers des données. Or, la mobilisation collective autour de ce type de sujet est relativement longue à organiser si on prend le temps d’associer l’ensemble des parties concernées.

La standardisation d’un jeu de données coûte de l’argent.
La standardisation d’un jeu de données nécessite la mobilisation de nombreuses ressources (humaines, expertises, animation, gouvernance, etc.) qui ne peuvent être mobilisées durablement de manière bénévole. Il est nécessaire que plusieurs acteurs bénéficiaires du projet financent la standardisation d’un ou plusieurs jeux de données thématiques. S’il y a des financeurs qui lisent l’article…

Il faut s’y mettre dès maintenant.
La construction d’un schéma réussi prend du temps et c’est pour cela qu’il faut s’y mettre dès maintenant ! Les participants de l’exploration souhaitent sortir assez rapidement un prototype pour pouvoir le présenter et le tester avec les usagers. C’est pourquoi les participants proposent de mettre en place début 2022 une gouvernance et un groupe de travail opérationnel, en nombre restreint mais représentant l’ensemble des acteurs de la médiation numérique, pour poursuivre les travaux de la standardisation des données de l’offre de médiation numérique.

Les questions (encore) ouvertes

Faut-il rester sur une base extensive de champs ou se concentrer sur un socle réduit ?
L’exploration nous a montré que les données collectées par les hubs et les acteurs nationaux ne contiennent pas le même niveau de détail et que les valeurs divergent. Nous avons deux options : continuer l’approche d’Aidants Connect avec près de 33 champs (et 2 obligatoires) ou réduire le nombre de champs à un socle réduit commun à tous les acteurs. Une structure qui guide vers des acteurs de la médiation numérique indiquait que les données détaillées sur les services ou la structure importaient peu : pour préconiser un acteur en confiance, elle devait prendre connaissance de son site et très souvent avoir un premier échange téléphonique. Notre expérience nous a montré que les champs facultatifs pouvaient intimider et repousser la standardisation de certaines données.

Faut-il recenser les lieux d’inclusion numérique ou l’ensemble des tiers lieux ?
Un schéma est en cours d’investigation sur la description des tiers-lieux qui devrait permettre de trouver des champs communs, compte tenu des similarités : beaucoup de lieux d’inclusion numérique proposent des tiers lieux, des espaces ouverts à la médiation numérique comme à d’autres sujets créant du lien sur un territoire même si de nombreux tiers-lieux n’ont pas investi l’inclusion numérique (au sein des espaces de coworking par exemple) ou ne traitent pas de questions numériques (alimentation, cuisine, couture ou fabrication).
Une autre approche serait de distinguer les données des lieux d’inclusion des données des services d’inclusion. Elle fait notamment écho au travail de l’équipe DORA.beta.gouv.
Cette distinction favoriserait à la fois l’interopérabilité des données et simplifierait le schéma des lieux d’inclusion numérique.

Avec qui concevoir le standard ?
Evidemment, les travaux de standardisation doivent être ouverts. Néanmoins, un noyau dur d’acteurs doit le porter, amorcer les travaux, définir une gouvernance, concevoir un calendrier et assumer des arbitrages.
À l’issue de cette exploration, nous considérons qu’il faut inclure les hubs territoriaux (qui collectent les données dans les régions), des acteurs de la médiation numérique (qui remplissent les formulaires), des acteurs intermédiaires comme Pôle Emploi (qui pourraient guider vers les structures), des représentants des collectivités territoriales (qui ont besoin de connaitre l’offre de médiation et orienter vers les structures), l’État (qui doit connaître la filière et mettre en place des dispositifs adaptés), des designers et entreprises (qui conçoivent des interfaces de production de données)…
Cette liste n’est pas exhaustive mais on peut penser à un système de cercles concentriques : un noyau dur qui amorce les travaux, un cercle plus large et ouvert pour affiner ces travaux avec une concertation ouverte.

Centraliser ou déconcentrer les données ?
Deux approches s’offrent à nous pour standardiser les données. L’approche centralisée consisterait à proposer un point unique dans lequel les acteurs de la médiation numérique en France pourraient se déclarer et décrire leur offre. L’approche décentralisée consisterait elle à s’appuyer sur les cartographies réalisées par les hubs et sur les outils nationaux existants. La seconde approche nous semble préférable car elle permet de valoriser la connaissance des acteurs des hubs et elle évite une coûteuse ressaisie des données.
Sans préjuger de l’approche sélectionnée par la suite, il sera nécessaire de creuser une question peu abordée lors de cette exploration : les outils de production de données.Ces derniers, s’ils sont bien pensés, favorisent grandement la production de données standardisées.

NOS ENGAGEMENTS

Quels engagements et actions pour la suite ?

ACTION 1

Mise en ligne d’une synthèse de l’exploration Données et territoire menée lors de NEC 2021, après collecte des différentes remarques et contributions.

ACTION 2

Mise en oeuvre d’un groupe de travail par la MedNum et poursuite des travaux pour l’émergence d’un standard des lieux de médiation numérique, accompagné par Datactivist.

ACTION 3

Création de temps forts autour du standard et présentation lors de NEC22.

> Prochain atelier le 8 avril 2022 de 14H00 à 16H00 autour du schéma de standardisation des données.

INSCRIPTION

 

Vous souhaitez en savoir plus, rejoindre le projet ou contacter les participant.e.s ?

Signalez-vous par mail auprès d’Angela qui vous mettra en relation avec les porteurs du projet : angela@numerique-en-commun.fr.