Faciliter l’accès aux données administratives en éducation : un partenariat fructueux entre le programme IDEE et le Ministère de l’Education nationale et de la Jeunesse

Posted on:
Authors:
Axelle Charpentier
A group sits at tables while two people stand facing a white board.
Units in charge of data production, the DEPP's IT team and researchers, among others, meet to discuss the IDEE data access tools.
Photo : Daniel Rakotomalala, J-PAL

En septembre 2021, le J-PAL Europe a lancé le programme Innovations, Données et Expérimentations en Éducation (IDEE) en partenariat avec la Direction de l’Évaluation, de la Prospective et de la Performance (DEPP), le service statistique du ministère de l’Éducation nationale et de la Jeunesse. Pour en savoir plus sur IDEE, vous pouvez consulter notre site ainsi que ce blog relatif à son événement de lancement.

Pourquoi faciliter l’accès des chercheurs aux données administratives ?

Face aux nombreux défis auxquels le système éducatif français est confronté, de nombreuses innovations ou politiques publiques sont mises en place. Toutefois, peu d’entre elles sont évaluées rigoureusement. IDEE vise à développer l’approche expérimentale dans la recherche en éducation afin d’identifier les programmes et les interventions les plus efficaces en France. Cela suppose de pouvoir s’appuyer sur des données fiables portant sur les élèves, les personnels et les établissements scolaires. Dans certains cas, la collecte de données via des enquêtes de terrain reste une étape incontournable, mais coûteuse. Et plus l’échantillon est grand, plus la tâche est lourde. Fort heureusement, de nombreuses données de qualité sur les compétences des élèves, leurs trajectoires scolaires, les parcours des personnels ou les caractéristiques des établissements existent déjà : ce sont les données administratives en éducation. 

Elles désignent un très grand nombre d’informations individuelles ou agrégées stockées de façon structurée et sécurisée. Elles peuvent donner lieu à des appariements dans un cadre législatif adapté. Un appariement consiste à fusionner deux ou plusieurs sources de données portant sur des indicateurs (relatifs aux parcours des élèves, à leurs apprentissages et/ou à leurs environnements scolaires) afin d’élargir considérablement les analyses.

La France, grâce au système d’information statistique (SI) de la DEPP, fait partie des pays qui détiennent les données administratives en éducation les plus riches au niveau européen, voire international. Le SI de la DEPP comprend des données pour près de : 

  • 60.000 écoles et établissements scolaires (caractéristiques et offre de formation, population scolaire, personnels et moyens, performance) 
  • 1,2 million de personnels de l’éducation nationale (caractéristiques individuelles, missions et lieux d’exercice, carrières, formation continue, etc.)
  • 13 millions d’élèves et apprentis (caractéristiques individuelles, environnement scolaire, résultats aux évaluations nationales et aux examens nationaux, parcours, etc.) 

Un accès facilité aux données administratives de la DEPP pour la communauté scientifique permet de réduire les coûts financiers et les temps d’enquête des recherches en éducation et donc d'accroître la productivité scientifique. Il permet également aux chercheurs de diversifier les sujets d’étude et de conduire davantage de recherches quantitatives à large échelle et/ou longitudinale. 

La DEPP a une riche activité de production d’études mais doit également pouvoir compter sur des partenariats avec le monde de la recherche pour favoriser la production de nouvelles connaissances sur le système éducatif et ainsi éclairer le débat public sur l’éducation. Le soutien à la recherche, via notamment l’accès aux données en éducation pour les chercheurs, fait partie de ses missions. Elle connaît par ailleurs ces dernières années une montée en puissance, tant en qualité qu’en quantité, de ses jeux de données, ce qui permet de nouvelles opportunités d’études empiriques et se traduit par une augmentation des demandes émanant des équipes de recherche. De nouveaux enjeux se font donc jour, comme une meilleure structuration et documentation de ses jeux de données. 

C’est pour répondre à ces besoins que le partenariat IDEE/DEPP s’est mis en place, comme l’illustrent les propos de Fabienne Rosenwald, directrice de la DEPP : « Avec le programme IDEE, nous développons avec des partenaires de confiance un système qui répond autant à nos besoins internes à la DEPP qu’à ceux du milieu de la recherche, tout en garantissant sécurité et confidentialité des données ». Cet engagement de la DEPP ouvre une voie sans précédent pour le monde de la recherche en éducation qui pourra bénéficier d’un meilleur accès à des données structurées et documentées.

Aujourd’hui, l’accès des chercheurs aux données de la DEPP s’inscrit dans un processus impliquant différentes étapes (sollicitation, expertise par la DEPP, échanges avec l’équipe de recherche, conventionnement éventuel et préparation/accès aux données), qui pourrait gagner en efficacité grâce à de nouveaux outils et ressources numériques, tout en maintenant les liens étroits pré-existants entre la DEPP et la communauté scientifique. Il y a par ailleurs un enjeu fort de diversification de la recherche pour permettre à des chercheurs de disciplines et d’universités variées d’exploiter les données en éducation : pour le moment, l’accès aux données individuelles ne peut se faire que dans les locaux de la DEPP, pour des questions de sécurité et de confidentialité des données. 

Et concrètement ?

Pour favoriser la recherche expérimentale en éducation, IDEE travaille en collaboration avec la DEPP pour développer de nouveaux outils et ressources informatiques. L’objectif étant de : 

  1. Créer et alimenter un catalogue des jeux de données existants, 
  2. Faciliter la mise en place et le suivi des conventions encadrant la mise à disposition des données,
  3. Permettre un accès à distance et sécurisé aux données pour les chercheurs. 

Le catalogue accessible en ligne est un outil d’information très précieux pour permettre aux équipes de recherche de bâtir et d’actualiser leurs protocoles d’étude. Pour la communauté scientifique moins familiarisée avec ces données, c’est un outil indispensable pour découvrir la richesse des données administratives et engager des projets de recherche innovants et pertinents. L’application de gestion des conventions vise à améliorer les processus liés au conventionnement, qui nécessitent l’intervention de plusieurs acteurs à la DEPP comme dans les universités/laboratoires portant les projets de recherche. C’est également une ressource précieuse pour la DEPP pour sa mission d’animation de la recherche en éducation. Enfin, au regard des enjeux de diversification et de multiplication de la recherche, il y a lieu de permettre à des chercheurs d’accéder à distance aux données administratives en éducation, tout en garantissant leur sécurité et confidentialité, grâce à une plateforme de consultation des données et de travail.

De telles innovations nécessitent des ressources supplémentaires, de nature humaine et financière, que le programme IDEE a fournies à la DEPP : sont ainsi intégrés aux équipes de la DEPP un ingénieur statisticien IDEE, Daniel Rakotomalala (docteur en sciences économiques), et une développeuse informatique IDEE, Maéva Mollion (docteure en bio-informatique). IDEE finance également des prestations de développement informatique. La réussite du projet repose sur des contacts étroits entre IDEE et la DEPP. « Ces échanges sont particulièrement favorisés par la mise à disposition de personnels IDEE au sein de la DEPP », comme le souligne Axelle Charpentier, cheffe du bureau de l’appui à l’évaluation des politiques publiques et de soutien à la recherche (B1) à la DEPP.

Maéva, au sein de l’équipe informatique de la DEPP (CISAD - Centre de l’informatique statistique et de l’aide à la décision), contribue au développement des outils informatiques susmentionnés. Par exemple, pour le catalogue, elle développe un outil centralisé de gestion de la documentation grâce auquel toutes les données pour la recherche pourront être facilement documentées par les bureaux producteurs. Elle développe également une partie de la plateforme d’accès à distance qui gère les environnements de travail, l’exploration des données et les demandes d’import (ajout de données d’enquêtes) et d’export (sortie de résultats) des chercheurs. 

Daniel, quant à lui, fait partie du bureau B1. En lien avec le travail de Maéva, il veille à l’optimisation des processus de documentation et de mise à disposition des données pour les besoins de la recherche mais aussi ceux des bureaux de la DEPP.

Les outils développés par la DEPP avec le soutien d’IDEE auront une vraie plus-value sociétale puisqu’ils permettront à tout type de chercheurs, indépendamment de leurs localisations, de leurs disciplines et de leur familiarité avec les données administratives en éducation, d’y accéder facilement et rapidement pour les exploiter à des fins de recherche. 

Où en est-on un an et demi plus tard ? 

Fabienne Rosenwald, directrice de la DEPP, souligne que « le bilan est très positif, à la fois s’agissant de la qualité de la relation de travail qui existe entre IDEE et la DEPP et des avancées si l’on pense aux objectifs du programme IDEE ». 

La première année, l’équipe d’IDEE a mené un travail d’investigation pour affiner les besoins qui avaient préalablement été identifiés. L’équipe informatique de la DEPP a rapidement commencé à réfléchir aux solutions techniques pour mettre en place un centre d’accès à distance et sécurisé aux données de la DEPP et aux implications en termes de développement informatique. 

La DEPP a publié le catalogue des données de la DEPP en novembre 2022 dont les contenus seront progressivement enrichis. 

Des comités d’utilisateurs composés de chercheurs, de membres d’IDEE et de la DEPP ont été mis en place pour assurer la cohérence et pertinence des outils numériques développés au regard des objectifs d’IDEE, des besoins de la communauté scientifique et de ceux de la DEPP. Au printemps 2023, ils se sont réunis pour expertiser les premières maquettes des outils numériques développés par la DEPP et faire des retours sur des fonctionnalités indispensables. Une version bêta intégrant l’ensemble des outils devrait prochainement voir le jour et permettre de premiers tests avec nos collègues chercheurs associés à la démarche collaborative de conception.

Et ensuite ?

Au-delà des questions d’accès aux données se posent des enjeux de diffusion et d’appropriation des résultats de la recherche expérimentale en éducation afin d’éclairer scientifiquement les politiques et les pratiques éducatives. Comme le souligne Fabienne Rosenwald, « la production et l’accumulation de connaissances scientifiques pour éclairer les politiques et les pratiques éducatives soulèvent des enjeux de capitalisation, de diffusion et d’appropriation des enseignements de la recherche en éducation ». Il s’agit notamment de permettre à l’ensemble des acteurs de l’éducation (décideurs, chefs d’établissement, enseignants, etc.) d’accéder facilement aux résultats de la recherche. Cela nécessite des actions de communication à leur endroit, mais également des actions de formation et de sensibilisation aux démarches d’évaluation qui sont portées aussi bien par IDEE que par la DEPP. 

Authored By