La politique de science ouverte du BRGM
Le BRGM, service géologique national, est un acteur de premier plan national et européen en matière de sciences et d’informations sur le sol, le sous-sol et ses ressources. Il joue un rôle croissant comme pôle de référence pour les données du sol et du sous-sol à la fois pour l’État et pour le compte d’infrastructures européennes comme l’European Plate Observing System (EPOS) et l’alliance des services géologiques européens EuroGeoSurveys, ou internationales notamment auprès de OneGeology.
Gestionnaire d’un très grand nombre de bases de données, totalement ouvertes, au titre de ses activités d’appui aux politiques publiques, il a la volonté d’ouvrir aussi le plus possible les résultats de ses activités de recherche.
Une politique de science ouverte élaborée en 2022
La politique de science ouverte du BRGM a pour ambition de structurer les pratiques à l’échelle de l’établissement et d’accélérer le processus dans toutes les dimensions scientifiques portées par le service géologique national.
Elle pose le principe de l’ouverture des données, des codes et des savoirs générés sur fonds publics comme la pratique de référence, tout en respectant les cadres liés au champs de la confidentialité pour les besoins de la Défense, du secret des affaires ou pour préserver la souveraineté nationale.
Les fondements de la politique de science ouverte du BRGM
La politique de science ouverte est basée sur les principes FAIR (Faciles à trouver, Accessibles, Interopérables et Réutilisables) et couvre l’ensemble du cycle de vie des données pour garantir une diffusion des données et résultats à long terme. Elle répond à 4 principes :
Garantir le respect de la réglementation et de la politique nationale en matière de sciences et données ouvertes
Le BRGM a joué un rôle de pionnier dans le mouvement d’ouverture des données et de leur interopérabilité en France depuis plus de 20 ans. Conformément à la réglementation française et européenne, l’établissement garantit que les résultats, les codes sources et données de son action scientifique acquises avec des financements publics sont mis à disposition, dans un souci de transparence de l’action publique et dans l’espoir d’aider au développement d’une activité économique directe ou indirecte. En tant qu’acteur économique, le BRGM pourra lui aussi participer, pour son propre compte, à la mise au point de services numériques payants qui exploiteront des données et codes gratuits de provenance très variée.
Garantir le respect de la propriété intellectuelle des résultats et données scientifiques
L’objectif de la politique de données et des codes du BRGM est de rendre les résultats scientifiques, les codes sources et données aussi ouverts que possible conformément aux dispositions de la science ouverte, mais également aussi de les protéger autant que nécessaire, lorsque les règles de propriété intellectuelle, de confidentialité, de souveraineté ou d’enjeux économiques l’imposent. Le BRGM s’engage à identifier le cadre juridique des données, codes et résultats scientifiques qu’il produit, qui lui sont confiés par des partenaires ou dont il fait l’acquisition. Cela implique la prise en compte, dans le système d’information, la gestion des méta-données des données, des codes (embargo inter/externe, cause, durée) permettant de déterminer les droits d’accès appropriés.
Gérer les données scientifiques sur l’ensemble de leur cycle de vie en appliquant les principes FAIR
L’ensemble des connaissances et données acquises ou produites par le BRGM pour des actions de recherche ou d’expertise, devra être géré suivant les principes FAIR (Faciles à trouver, Accessibles, Interopérables et Réutilisables) à l’aide d’un processus décrit dans le système qualité du BRGM. Appliquer les principes FAIR sur le cycle des données depuis l’acquisition des données brutes sur le terrain ou expérimentales et analytiques, jusqu’aux données transformées et résultats numériques. L’ensemble des données produites doit systématiquement faire l’objet d’une description et d’une sauvegarde dans les plateformes numériques du BRGM afin d’en permettre des réutilisations ultérieures. Adopter autant que possible les standards de la profession pour gérer les données et codes scientifiques et assurer leur future interopérabilité et donc leur ré-utilisabilité.
Garantir la préservation et la diffusion des données et résultats à long terme
Établissement public de recherche, le BRGM a la responsabilité de garantir la préservation et l’absence de compromission des données sur le long terme. Au-delà d’un objectif réglementaire, l’enjeu est de permettre de capitaliser à l’échelle nationale la connaissance du sous-sol qui relève d’une démarche agrégative, d’aider au développement des nouveaux usages, mais aussi de disposer et mettre à disposition des séries longues sur les données du sous-sol et de l’environnement.
Le BRGM, acteur-clé pour la diffusion des données géologiques et environnementales
Le BRGM met à disposition ses données géologiques et environnementales à travers différentes technologies numériques. Des informations à forte valeur ajoutée, outils précieux d’aide à la décision.
Sur son portail InfoTerre, le BRGM offre un accès libre et gratuit à ses rapports et cartes géologiques, aux données de ses banques d’information (Banque du sous-sol, sites industriels, risques naturels, etc.) et à de nombreuses autres données géoscientifiques.
Le BRGM met notamment à disposition en téléchargement gratuit sur le portail InfoTerre :
- ses cartes géologiques vectorisées et harmonisées à l’échelle 1/50 000, ainsi que la carte géologique de la France hexagonale à l’échelle 1/1 000 000, outils d’aide à la décision pour les pouvoirs publics, les aménageurs, les bureaux d’études, dans des domaines variés tels que l'aménagement du territoire, la prospection des ressources minérales, l'exploration et la protection des eaux souterraines, la lutte contre les pollutions, la prévention des risques naturels ou encore la caractérisation des terroirs ;
- la Banque du Sous-Sol (BSS), qui recense les fiches signalétiques de plus de 800.000 ouvrages, associés à plus de 2.000.000 de pages de documents techniques. Elle contient des informations brutes géologiques et techniques relatives à des ouvrages souterrains : localisation, objet, description géologique, équipement technique des forages.
À la demande des pouvoirs publics, le BRGM pilote et gère également plusieurs dizaines de sites web et bases de données, dans les domaines de la géologie, des risques (Géorisques), de l’eau (ADES), des ressources minérales (Minéralinfo), de la géothermie (Géothermies), etc.
Pour faciliter l’accès à ses données depuis n’importe quel point du territoire, le BRGM propose également trois applications mobiles : i-InfoTerre (version nomade du portail web InfoTerre), InfoNappe (sur les eaux souterraines) et InfoGéol (sur la géologie de la France).
Interopérabilité des données : une expertise forte
Le BRGM, acteur majeur de la collecte, de la valorisation et de la mise à disposition de données géoréférencées sur les géosciences et l’environnement, a été l’un des pionniers dans la réflexion et la conceptualisation du principe d’interopérabilité de systèmes d’information. Son implication dans la définition et la mise en œuvre des standards de traitement et de diffusion de l’information géo-environnementale lui confère une expertise régulièrement sollicitée dans les projets et partenariats de recherche en France comme en Europe.
Le BRGM est ainsi fortement impliqué dans la construction des standards au sein de l’OGC et de l’IUGS-CGI. Il est l’un des principaux contributeurs dans la définition des règles et des normes de la directive européenne INSPIRE, qui vise, à terme, la mise en ligne de toute l’information publique environnementale européenne. Il joue aussi un rôle essentiel dans les initiatives internationales (GEOSS, OneGeology).
Données, services et infrastructures numériques : un enjeu stratégique pour le BRGM
Le BRGM collecte, héberge et diffuse les données géologiques et environnementales qui constituent aussi une matière première pour une science nouvelle. Il se positionne comme l’un des principaux établissements de référence à l’échelle nationale et européenne sur la gestion du cycle des données géoscientifiques et environnementales.
Sites web, applications et bases de données
Baromètre de la science ouverte du BRGM 2023
Une ouverture accrue des publications du BRGM
Le BRGM a mis en place son baromètre de la science ouverte selon des standards du ministère de le Recherche et de l’Enseignement supérieur depuis 2022. En 2023, 85% des 227 publications scientifiques 2022 sont disponibles en accès ouvert. Un résultat encore en progression par rapport aux cinq dernières années et de plus de 24 points sur la période. Le taux d’ouverture est désormais nettement supérieur à la moyenne française qui stagne sur la période 2021-2022 (65%). Ce taux d’ouverture est supérieur de 12 points au taux national dans la catégorie des sciences de la Terre, écologie, énergie et biologie appliquée (73%). La progression du taux d’ouverture se limite désormais à +1 à +2% par an, par rapport aux grands mouvements d’ouverture de certaines revues entre 2017 et 2019.
On constate toutefois toujours des écarts importants des taux d’ouverture des publications plus anciennes antérieures à 2019 avec des taux inférieurs à 50%. Cela démontre surtout l’évolution des politiques d’ouverture en matière de publications à la fois de la part des éditeurs et des choix des auteurs en matière de revues.
Les voies d’ouverture des publications scientifiques du BRGM
L'accès ouvert aux publications scientifiques peut se faire par plusieurs voies : la publication nativement en accès ouvert par l'éditeur sur une plateforme de publication (accès sans abonnement) ou le dépôt par l'auteur dans une archive ouverte, tel que la plateforme nationale HAL, que le BRGM alimente depuis 2010 via son portail HAL-BRGM.
Ces deux voies ne sont pas exclusives, une publication pouvant être à la fois disponible sur une archive ouverte et sur la plateforme de publication de l'éditeur. Au BRGM cela représente désormais plus de 55% des publications. Cette simultanéité, qui tend à s'accroître dans la plupart des établissements permet à la fois une meilleure visibilité et référencement des publications sur internet, mais surtout garantit la pérennité de l'accès aux publications scientifiques françaises. 12% des publications en 2022 sont hébergées exclusivement sur la plateforme de l’éditeur. Cette forte augmentation est due à une ouverture des publications de la part de des éditeurs, sans que le signalement de cette ouverture soit fait par ailleurs. Cela nécessite de la part de l’auteur une action pour que le fichier éditeur soit également déposé sur HAL, ce qui n’est pas systématiquement réalisé. La part de dépôt exclusif sur archive ouverte (type HAL-BRGM) tend à diminuer avec le temps (19% en 2022), cela reflète principalement l’évolution des politiques d’ouverture systématique des éditeurs.
HAL est l’archive ouverte principale du BRGM
Pour faciliter l’accès ouvert à ses publications, le BRGM s’est adossé à la plateforme nationale HAL, via son portail HAL-BRGM, avec un taux observé en 2022 de 73% des publications parues en 2021. Ce taux plafonne depuis 2019. Le BRGM a pris l’initiative de centraliser le dépôt systématique des publications dans HAL, en respectant les droits des éditeurs, cependant l’ouverture progressive par les éditeurs se faisant sans signalement de leur part, on observe un décalage de 12% correspondant à une ouverture uniquement sur le site de l’éditeur. Une campagne de rattrapage devra être effectuée sur HAL en plus du service de suggestion proposé par le CCSD. Des dépôts sont également présents sur les archives institutionnelles françaises des co-auteurs BRGM qui en sont pourvu tels que l’IFREMER (Archimer) ou celle des cinq établissements d'enseignement supérieur du site bordelais (Oskar Bordeaux). 6% des dépôts se font également sur Pubmed Central.
La totalité des thèses co-encadrées par le BRGM en accès ouvert
Dans le cadre du programme doctoral du BRGM, près d’une trentaine de thèses sont soutenues par an. Une procédure de suivi des thèses a été mise en place et d’archivage systématique dans HAL dès la mise en ligne sur thèse.fr.
Le dépôt dans HAL devient systématique avec un taux d’ouverture de 100% sur HAL et sur theses.fr pour les soutenances de 2022. Il est à noter que le BRGM n’est pas autorisé à effectuer le dépôt des thèses dans HAL, celui-ci devant être effectué par les Universités de délivrance du diplôme, au travers du circuit national de dépôt des thèses.
Des jeux de données plus fréquemment accessibles, mais une ouverture encore perfectible
Au-delà de l’accès ouvert des publications scientifiques, l’accès aux données ayant permis les travaux de recherche est un paramètre important dans la politique de science ouverte du BRGM pour assoir la crédibilité des travaux et garantir leur reproductibilité.
C’est pourquoi un indicateur de disponibilité des jeux de données à la source d’un article scientifique (Data availability statement) est un indicateur important. Cette pratique de déclaration sur la mise à disposition des données est en progression, mais encore insuffisamment répandue.
On lui préfère généralement une simple mention de production de données. Avec un taux en hausse pour les publications de 2022 (57%). Et parmi ces publications qui mentionnent la production de données, seules 28% mentionnent un partage de données.
Le baromètre français de la science ouverte décliné pour les établissements publics
Le baromètre de la science ouverte est un ensemble d’indicateurs initiés par le ministère de l'Enseignement supérieur et de la Recherche en 2022 pour mesurer la part des publications scientifiques en accès ouvert au niveau national.
Il s’agit de mesurer et comparer l’évolution des pratiques de science ouverte en France, à partir de données fiables, ouvertes et reposant sur une méthodologie partagée.
Chaque établissement peut accéder librement aux résultats de son propre baromètre, à partir des données de ses publications scientifiques.
Le BRGM diffuse les principaux résultats de son baromètre science ouverte depuis 2022.