L'enjeu
L'enjeu lié à la volumétrie des données est bien connu. En revanche, les aspects liés à la pérennisation et la fiabilisation des données et connaissances acquises, notamment au travers de référentiels officiels et interopérables pour améliorer la modélisation prédictive des géosciences, sont encore largement à construire. Le BRGM possède une large expertise dans le domaine de la gestion de données géoscientifiques de référence (OneGeology, EPOS, RGF, etc.). Sa compétence thématique propre porte essentiellement sur la production de données en « géosciences », leur référencement et leur interopérabilité. Il devient désormais nécessaire de développer des capacités à mobiliser, accéder, traiter, combiner d’autres types de données de spectre plus large pour assurer des missions d’information sur l’état du sol et du sous-sol.
Bases de données géoscientifiques et sites web de diffusion de données du BRGM.
© BRGM
L'ambition du BRGM
Pour le BRGM, il s’agit de se positionner comme l’un des principaux établissements de référence à l’échelle nationale et européenne sur la gestion du cycle des données géoscientifiques et environnementales, dans un contexte de généralisation des politiques de science et données ouvertes et de montée en puissance de « nouveaux » acteurs (académiques, entreprises, citoyens). Le challenge scientifique principal du programme « Données, services et infrastructures numériques » qui couvre cet enjeu est désormais d’adapter les nouveaux concepts et outils des sciences de la donnée aux problématiques des sciences de la Terre et de l’environnement.
Nos solutions
Dernières actualités
Nos références et projets
Nos résultats et données
Sites web, applications et bases de données
Comprendre les sciences de la Terre
Programme scientifique : Données, services et infrastructures numériques
Le positionnement du programme en matière de recherche est spécifique car il se situe à l’interface avec les sept autres programmes scientifiques et avec le domaine des sciences du numérique. L’enjeu en matière de recherche est d’être à la pointe en matière d’intégration des innovations scientifiques issues des sciences du numérique et de l’appliquer aux problématiques du BRGM.
Les challenges scientifiques sont de différentes natures et vont principalement porter sur le cycle de la donnée géoscientifique et environnementale, comme la production de référentiels en géosciences et d’interfaçage avec des référentiels issus d’autres secteurs, ou encore les applications issues des sciences de la donnée en matière de services et modèles prédictifs.
Structurer le système d'information des données de la collecte à leur valorisation dans un contexte d'hétérogénéité et d'afflux croissant
Les stratégies européenne et nationale d’infrastructures de données de recherche (ESFRIs) donnent une opportunité au BRGM de se positionner comme acteur important dans le dispositif qui se met en place (infrastructures européenne EPOS et nationale Data Terra). Il s’agit d’offrir un ensemble de compétences et d'outils nécessaires au développement et à la gestion d’une infrastructure de données en s’appuyant sur le data center du BRGM. On poursuivra l’intégration des méthodes et outils permettant d’offrir aux chercheurs les moyens dont ils ont besoin sur l’ensemble de la chaîne du cycle de données.
En cela, il s’agit de garantir la mise en place d’une chaîne de gestion complète de la donnée produite ou acquise dans le cadre de l’ensemble des activités du BRGM pour produire des services à partir de ces ressources. La démarche sera aussi transversale que possible (afin de faire disparaître progressivement les différences entre différentes chaînes de production des données). Cela suppose également de développer et de mettre en place les mécanismes permettant « d’enrichir » les données tout au long de leur cycle de vie.
Orientations de recherche
- Développer les mécanismes d’intégration des données non structurées (littérature scientifique, notes de terrain…) dans les systèmes d’information, permettant l’extraction de connaissances à partir de ces données.
- Développer les méthodes d’acquisition et d’enrichissement des métadonnées tout au long du cycle de vie des données notamment à travers des méthodes assistées dans les outils de traitement.
- Améliorer les outils de traçabilité de la qualification, de l’interprétation et du filtrage des données tout au long des traitements.
Développer des référentiels de données et connaissances des géosciences pour répondre à la diversité des enjeux et des acteurs
Il s’agit de pouvoir disposer et d'accéder aux données, informations et connaissances en chaque point du sous-sol du territoire pour chaque thématique et pour l’ensemble des domaines de compétences du BRGM. Pour permettre le croisement des données produites par les disciplines internes au BRGM avec d’autres types de données produites par d’autres acteurs, il importe de continuer à poursuivre la démarche d’interopérabilité débutée depuis plus de 15 ans. En pratique, on s’attachera à identifier ou définir dans chaque domaine les bases de référentiels (concepts et ontologies partagés, vocabulaires, registres…), les pratiques d’identifiants uniques, etc., pour rendre possible l’exploitation de ces données par le biais de techniques du « linked data ».
On développera également les « passerelles » permettant de rapprocher les données géo-environnementales des données de la construction (BIM) en intervenant dans les démarches de standardisation conjointes.
Orientations de recherche
- Constitution des référentiels du sol et du sous-sol en assurant leur interopérabilité, afin de permettre notamment de restituer en tout point du territoire l’ensemble des données de référence.
- Mécanismes d’intégration des référentiels du sous-sol avec d’autres référentiels (systèmes urbains).
- Mécanismes d’interopérabilité sémantique en lien avec les domaines thématiques du BRGM.
Intégrer les outils et méthodes de la data science pour améliorer la modélisation prédictive en géosciences, accroître la production de connaissances et développer des services numériques
Il s’agira de s’approprier ces nouveaux outils pour proposer de nouvelles approches ou améliorer les performances des méthodes traditionnelles en matière de prédictivité, de détection de signaux faibles ou encore d’études de sensibilité. La question de la confiance et des incertitudes liées à ces méthodes, et la capacité à baser des décisions sur leurs résultats seront spécifiquement explorées.
Orientations de recherche
- Briques pour des services prédictifs (éventuellement en temps réel) en s’appuyant sur les techniques de la data science à partir de modèles validés par des méthodes « traditionnelles » (ex. MetéEauNappes).
- Confiance et « interprétabilité » des modèles prédictifs produits par la science des données en travaillant sur « l’explicabilité » des résultats.
- Maîtrise des incertitudes sur les résultats de modélisation en utilisant des méthodes évaluant la sensibilité sur les paramètres d’entrée à travers des approches big data.