Sommaire
    Le BRGM, service géologique national, s’engage en matière d'ouverture des données et des connaissances. La politique de science ouverte du BRGM vise à positionner l’établissement comme pôle de référence national et européen pour les données du sol et du sous-sol.

    La politique de science ouverte du BRGM

    Le BRGM, service géologique national, est un acteur de premier plan national et européen en matière de sciences et d’informations sur le sol, le sous-sol et ses ressources. Il joue un rôle croissant comme pôle de référence pour les données du sol et du sous-sol à la fois pour l’État et pour le compte d’infrastructures européennes comme l’European Plate Observing System (EPOS) et l’alliance des services géologiques européens EuroGeoSurveys, ou internationales notamment auprès de OneGeology.

    Gestionnaire d’un très grand nombre de bases de données, totalement ouvertes, au titre de ses activités d’appui aux politiques publiques, il a la volonté d’ouvrir aussi le plus possible les résultats de ses activités de recherche.

    Une politique de science ouverte élaborée en 2022

    La politique de science ouverte du BRGM a pour ambition de structurer les pratiques à l’échelle de l’établissement et d’accélérer le processus dans toutes les dimensions scientifiques portées par le service géologique national.

    Elle pose le principe de l’ouverture des données, des codes et des savoirs générés sur fonds publics comme la pratique de référence, tout en respectant les cadres liés au champs de la confidentialité pour les besoins de la Défense, du secret des affaires ou pour préserver la souveraineté nationale.

    Les fondements de la politique de science ouverte du BRGM

    La politique de science ouverte est basée sur les principes FAIR (Faciles à trouver, Accessibles, Interopérables et Réutilisables) et couvre l’ensemble du cycle de vie des données pour garantir une diffusion des données et résultats à long terme. Elle répond à 4 principes :

    Le BRGM a joué un rôle de pionnier dans le mouvement d’ouverture des données et de leur interopérabilité en France depuis plus de 20 ans. Conformément à la réglementation française et européenne, l’établissement garantit que les résultats, les codes sources et données de son action scientifique acquises avec des financements publics sont mis à disposition, dans un souci de transparence de l’action publique et dans l’espoir d’aider au développement d’une activité économique directe ou indirecte. En tant qu’acteur économique, le BRGM pourra lui aussi participer, pour son propre compte, à la mise au point de services numériques payants qui exploiteront des données et codes gratuits de provenance très variée.

    L’objectif de la politique de données et des codes du BRGM est de rendre les résultats scientifiques, les codes sources et données aussi ouverts que possible conformément aux dispositions de la science ouverte, mais également aussi de les protéger autant que nécessaire, lorsque les règles de propriété intellectuelle, de confidentialité, de souveraineté ou d’enjeux économiques l’imposent. Le BRGM s’engage à identifier le cadre juridique des données, codes et résultats scientifiques qu’il produit, qui lui sont confiés par des partenaires ou dont il fait l’acquisition. Cela implique la prise en compte, dans le système d’information, la gestion des méta-données des données, des codes (embargo inter/externe, cause, durée) permettant de déterminer les droits d’accès appropriés.

    L’ensemble des connaissances et données acquises ou produites par le BRGM pour des actions de recherche ou d’expertise, devra être géré suivant les principes FAIR (Faciles à trouver, Accessibles, Interopérables et Réutilisables) à l’aide d’un processus décrit dans le système qualité du BRGM. Appliquer les principes FAIR sur le cycle des données depuis l’acquisition des données brutes sur le terrain ou expérimentales et analytiques, jusqu’aux données transformées et résultats numériques. L’ensemble des données produites doit systématiquement faire l’objet d’une description et d’une sauvegarde dans les plateformes numériques du BRGM afin d’en permettre des réutilisations ultérieures. Adopter autant que possible les standards de la profession pour gérer les données et codes scientifiques et assurer leur future interopérabilité et donc leur ré-utilisabilité.

    Établissement public de recherche, le BRGM a la responsabilité de garantir la préservation et l’absence de compromission des données sur le long terme. Au-delà d’un objectif réglementaire, l’enjeu est de permettre de capitaliser à l’échelle nationale la connaissance du sous-sol qui relève d’une démarche agrégative, d’aider au développement des nouveaux usages, mais aussi de disposer et mettre à disposition des séries longues sur les données du sous-sol et de l’environnement.

    Carte géologique de la France au 1/1000 000

    Carte géologique de la France au 1/1000 000. 

    © BRGM 

    Le BRGM, acteur-clé pour la diffusion des données géologiques et environnementales

    Le BRGM met à disposition ses données géologiques et environnementales à travers différentes technologies numériques. Des informations à forte valeur ajoutée, outils précieux d’aide à la décision.

    Sur son portail InfoTerre, le BRGM offre un accès libre et gratuit à ses rapports et cartes géologiques, aux données de ses banques d’information (Banque du sous-sol, sites industriels, risques naturels, etc.) et à de nombreuses autres données géoscientifiques.

    Le BRGM met notamment à disposition en téléchargement gratuit sur le portail InfoTerre :

    • ses cartes géologiques vectorisées et harmonisées à l’échelle 1/50 000, ainsi que la carte géologique de la France hexagonale à l’échelle 1/1 000 000, outils d’aide à la décision pour les pouvoirs publics, les aménageurs, les bureaux d’études, dans des domaines variés tels que l'aménagement du territoire, la prospection des ressources minérales, l'exploration et la protection des eaux souterraines, la lutte contre les pollutions, la prévention des risques naturels ou encore la caractérisation des terroirs ;
    • la Banque du Sous-Sol (BSS), qui recense les fiches signalétiques de plus de 800.000 ouvrages, associés à plus de 2.000.000 de pages de documents techniques. Elle contient des informations brutes géologiques et techniques relatives à des ouvrages souterrains : localisation, objet, description géologique, équipement technique des forages.

    À la demande des pouvoirs publics, le BRGM pilote et gère également plusieurs dizaines de sites web et bases de données, dans les domaines de la géologie, des risques (Géorisques), de l’eau (ADES), des ressources minérales (Minéralinfo), de la géothermie (Géothermies), etc.

    Pour faciliter l’accès à ses données depuis n’importe quel point du territoire, le BRGM propose également trois applications mobiles : i-InfoTerre (version nomade du portail web InfoTerre), InfoNappe (sur les eaux souterraines) et InfoGéol (sur la géologie de la France).

    Interopérabilité des données : une expertise forte

    Le BRGM, acteur majeur de la collecte, de la valorisation et de la mise à disposition de données géoréférencées sur les géosciences et l’environnement, a été l’un des pionniers dans la réflexion et la conceptualisation du principe d’interopérabilité de systèmes d’information. Son implication dans la définition et la mise en œuvre des standards de traitement et de diffusion de l’information géo-environnementale lui confère une expertise régulièrement sollicitée dans les projets et partenariats de recherche en France comme en Europe.

    Le BRGM est ainsi fortement impliqué dans la construction des standards au sein de l’OGC et de l’IUGS-CGI. Il est l’un des principaux contributeurs dans la définition des règles et des normes de la directive européenne INSPIRE, qui vise, à terme, la mise en ligne de toute l’information publique environnementale européenne. Il joue aussi un rôle essentiel dans les initiatives internationales (GEOSS, OneGeology).

    Modèle 3D d’une carrière souterraine à Orléans

    Numérique pour les géosciences : un enjeu stratégique pour le BRGM

    Le BRGM collecte, héberge et diffuse les données géologiques et environnementales qui constituent aussi une matière première pour une science nouvelle. Il se positionne comme l’un des principaux établissements de référence à l’échelle nationale et européenne sur la gestion du cycle des données géoscientifiques et environnementales.

    Les douze apôtres, Australie
    Dans le cadre de sa politique générale de science ouverte, le BRGM publie depuis 2022 les résultats les plus marquants de son baromètre science ouverte.

    Une ouverture accrue des publications du BRGM

    Le BRGM a mis en place son baromètre de la science ouverte selon des standards du ministère de la Recherche et de l’Enseignement supérieur depuis 2018. 

    On observe en 2024 une légère progression de +2% de publications ouvertes par rapport aux années 2022 et 2023. Mais surtout cette progression montre une croissance de plus de 39 points sur 5 ans. Le taux d’ouverture est désormais nettement supérieur à la moyenne française qui stagne sur la période 2021-2022 (65%). Ce taux d’ouverture en 2022 est supérieur de 11 points au taux national dans la catégorie des sciences de la Terre, écologie, énergie et biologie appliquée (73%). Il semble que le système ait atteint un palier depuis 3 ans avec une progression du taux d’ouverture désormais de +1 à +2% par an.

    On constate toutefois toujours des écarts importants des taux d’ouvertures des publications plus anciennes antérieures à 2020 avec des taux d’ouverture inférieurs à 50%. Cela démontre surtout l’évolution des politiques d’ouverture en matière de publications à la fois de la part des éditeurs et des choix des auteurs en matière de revues.

    Taux d'accès ouvert des publications scientifiques du BRGM, avec un DOI Crossref, parues durant l'année précédente par année d'observation

    Évolution du taux d'accès ouvert des publications scientifiques du BRGM, avec un DOI Crossref, par année d'observation

    Les voies d’ouverture des publications scientifiques du BRGM

    L'accès ouvert aux publications scientifiques peut se faire par plusieurs voies : la publication nativement en accès ouvert par l'éditeur sur une plateforme de publication (accès sans abonnement) ou le dépôt par l'auteur dans une archive ouverte, telle que la plateforme nationale HAL, que le BRGM alimente depuis 2010 via son portail HAL-BRGM.

    Ces deux voies ne sont pas exclusives, une publication pouvant être à la fois disponible sur une archive ouverte et sur la plateforme de publication de l'éditeur.  Il s’agit là désormais du mode d’ouverture principal. Cela représente désormais 60% des publications, mais en régression par rapport à l’an passé (68%). Le dépôt unique en archive ouverte par l’auteur sur une plateforme stagne et ne représente plus que 16%. Cela nécessite de la part de l’auteur une action pour que le fichier éditeur soit également déposé sur HAL, ce qui n’est pas systématiquement réalisé. On constate également une croissance marginale de la part des publications hébergées exclusivement sur la plateforme de l’éditeur (7% contre 1% en 2023). Ce mode d’ouverture reflète principalement l’évolution des politiques d’ouverture systématique de certains éditeurs.

    Répartition des publications scientifiques du BRGM, avec un DOI Crossref, en accès ouvert par voie d'ouverture et par année de publication (observé en 2024)

    Taux d'accès ouvert par type de publications du BRGM, avec un DOI Crossref, publications de 2023

    HAL est l’archive ouverte principale du BRGM

    Pour faciliter l’accès ouvert à ses publications, le BRGM s’est adossé à la plateforme nationale HAL, via son portail HAL-BRGM, avec un taux observé en 2023 de 73% des publications parues en 2023. Ce taux plafonne depuis 2019. 

    Le BRGM a pris l’initiative de centraliser le dépôt systématique des publications dans HAL, en respectant les droits des éditeurs, cependant l’ouverture progressive par les éditeurs se faisant sans signalement de leur part, on observe un décalage temporaire de 7% correspondant à une ouverture uniquement sur le site de l’éditeur. Des dépôts sont également présents sur les archives institutionnelles françaises des co-auteurs BRGM qui en sont pourvu tels que l’IFREMER (Archimer) ou celle des cinq établissements d'enseignement supérieur du site bordelais (Oskar Bordeaux). 6% des dépôts se font également sur Pubmed Central.

    Évolution du taux de publications scientifiques du BRGM, avec un DOI Crossref, hébergées sur une archive ouverte, par année d'observation

    Évolution des modèles économiques pour les articles diffusés en accès ouvert par leur éditeur, par année de publication

    Ce graphique indique la répartition des articles scientifiques et diffusés en accès ouvert par leur éditeur, en fonction du modèle économique de la revue dans laquelle ils sont publiés. Il distingue quatre types de modèles économiques : les articles publiés dans des revues entièrement en accès ouvert qui ne facturent pas de frais de publication ("diamant"), les articles publiés dans des revues entièrement en accès ouvert qui facturent des frais de publication ("Gold full APC"), et des articles publiés dans des revues hybrides (dont une partie du contenu seulement est en accès ouvert et l'autre partie est ouverte par des frais de publications payés individuellement), et enfin tous les autres cas. 

    Malgré une politique générale de science ouverte préconisant un accès ouvert de type « Green », c’est-à-dire archivage public gratuit après la période d’embargo, une part importante des auteurs (39% des publications ouvertes) et stable applique encore en 2023 le modèle « Gold » payant. On observe que le modèle « diamant » commence à se développer et a doublé (13%) par rapport à 2022.

    Taux d'accès ouvert par langue de publications du BRGM, avec un DOI Crossref, publications de 2023

    On remarque notamment que, parmi les publications parues en 2023, on dénombre 192 publications en anglais dont 165 ouvertes et 27 fermées (soit un taux d'accès ouvert de 86 %), et 10 publications en français dont 8 ouvertes et 2 fermées (soit un taux de 80 %). Les publications en langue française sont donc moins ouvertes que les publications en langue anglaise. Les publications en espagnol, allemand et portugais représentent de plus petits effectifs, statistiquement moins significatifs.

    Une ouverture systématique des thèses dans l’archive ouverte HAL

    Dans le cadre du programme doctoral du BRGM, près d’une trentaine de thèses sont soutenues par an. Une procédure de suivi des thèses a été mise en place et d’archivage systématique dans HAL dès la mise en ligne sur thèse.fr. 

    Le dépôt dans HAL devient systématique avec un taux d’ouverture de 100% sur HAL et sur theses.fr pour les soutenances de 2023. Il est à noter que le BRGM n’est pas autorisé à effectuer le dépôt des thèses dans HAL, celui-ci devant être effectué par les Universités de délivrance du diplôme, au travers du circuit national de dépôt des thèses.

    Taux d'ouverture des thèses de doctorat du BRGM par année de soutenance (observées en 2024)

    Des jeux de données plus fréquemment accessibles, mais une ouverture encore perfectible

    Au-delà de l’accès ouvert des publications scientifiques, l’accès aux données ayant permis les travaux de recherche est un paramètre important dans la politique de science ouverte du BRGM pour assoir la crédibilité des travaux et garantir leur reproductibilité.

    C’est pourquoi un indicateur de disponibilité des jeux de données à la source d’un article scientifique (Data availability statement) est un indicateur important. Cette pratique de déclaration sur la mise à disposition des données est en progression, mais encore insuffisamment répandue.

    Une procédure interne de structuration des jeux de données et d’archivage ouvert est désormais opérationnelle et l’on observe une pratique croissante des auteurs mentionnant une production de données qui s’établit désormais à 60% en progression régulière depuis 4 ans.

    Proportion de publications du BRGM qui mentionnent avoir produit leurs données par année de publication

    Proportion de publications du BRGM qui incluent une section "Data Availability Statement" (déclaration sur la mise à disposition des données) par année de publication

    Ce graphique montre la proportion de publications qui déclarent rendre disponibles les données (mention d'un Data Availability Statement identifiée), par année de publication. La présence d'un Data Availability Statement dans le corps de la publication ne signifie pas pour autant que les auteurs de la publication partagent effectivement leurs données quand la demande leur en est faite. Ce graphique montre, par année de publication, la proportion de publications pour lesquelles une mention de partage de données a été détectée, parmi les publications qui mentionnent la production de données. 

    On observe une croissance significative de publications déclarant une mise à disposition des données. En 2023, c’est près de la moitié des publications (pour 31-35% des 2 années précédentes). Cela est probablement dû à la mise en place d’outils internes opérationnels pour héberger ces données et les mettre à disposition.

    Le baromètre français de la science ouverte décliné pour les établissements publics

    Le baromètre de la science ouverte est un ensemble d’indicateurs initiés par le ministère de l'Enseignement supérieur et de la Recherche en 2022 pour mesurer la part des publications scientifiques en accès ouvert au niveau national.

    Il s’agit de mesurer et comparer l’évolution des pratiques de science ouverte en France, à partir de données fiables, ouvertes et reposant sur une méthodologie partagée.

    Chaque établissement peut accéder librement aux résultats de son propre baromètre, à partir des données de ses publications scientifiques.

    Le BRGM diffuse les principaux résultats de son baromètre science ouverte depuis 2022.

    Méthodologie

    Le baromètre de la science ouverte (BSO) étudie le type d'accès (fermé/ouvert) aux publications scientifiques (articles de journaux, actes de conférences, preprints, chapitres de livres, autres) ayant un Digital Object Identifier (DOI) et dont au moins un auteur a une affiliation française.

    Le BSO repose uniquement sur des sources ouvertes, en particulier Unpaywall et HAL. Si l'accès est ouvert, trois types d'accès sont distingués suivant que l'accès au texte intégral se fait directement chez l'éditeur, sur une archive ouverte ou sur les deux.

    Le BSO intègre les publications scientifiques dont l'année de publication est postérieure à 2012. Il est mis à jour chaque fin d'année.

    Les résultats du baromètre BRGM de la science ouverte sont une déclinaison directe de ceux du Baromètre français de la Science Ouverte, appliquée à la liste des publications scientifiques fournie par le BRGM.