SOURCIER/STRATHO/CARRIER : Des moteurs de recherches sur les données géoscientifiques

Capitalisant l’expérience acquise avec le Géocatalogue puis avec le portail Tout sur l’environnement, le BRGM a engagé un nouveau partenariat avec la société Exalead, créatrice d’un moteur d’indexation (textuelle, sémantique) et de recherche capable de donner accès à un grand nombre de types de données aux formats disparates. Objectif : intégrer cette technologie du Web pour des besoins scientifiques, notamment autour de la fouille de données (data mining) et la restitution rapide d’informations géoscientifiques.

Sourcier : un nouvel outil d’accès à l’information sur le domaine de l’eau

Le projet vise la réalisation de démonstrateurs appliqués aux enjeux de trois « métiers » du BRGM, en se fondant sur le développement de certaines fonctionnalités manquantes du moteur de recherche d’Exalead et sur une évolution de celui-ci. Un nouvel outil d’accès à l’information sur l’eau, Sourcier, a été conçu en 2009-2010.

 

Permettant des recherches dans la base nationale d’accès aux données sur les eaux souterraines gérée par le BRGM (ADES), il a démontré qu’il était possible d’offrir un accès efficace et rapide à 14 millions d’analyses qualito- chimiques provenant de 60 000 points d’eau, en levant le problème de la recherche spatiale dans un index initialement dépourvu de notion de géométrie (représentation des géométries sous forme de C-Squares).

 

Sourcier propose à l’utilisateur une recherche simple sur plusieurs dimensions (paramètres et concentration, période de l’analyse et zone spatiale d’étude). Il intègre un affichage cartographique. Certains résultats de Sourcier sont aujourd’hui intégrés à InfoTerre, portail d’accès aux données géoscientifiques du BRGM.

 

Recherche rapide de mesures en nitrates excédant le seuil de potabilité dans la région de Rennes de 2000 à 2009.

Stratho indexe les bases de données BRGM pour le grand public

Stratho (2010-2011) est orienté vers le grand public. Il indexe toutes les bases de données du BRGM comportant des notions de stratigraphie et de lithologie (ADES, BSS, rapports scientifiques, photographies…). Il a permis, au moyen d’un nouveau produit issu de la recherche et développement d’Exalead (Cloud- View 360°), d’effectuer des recherches en parallèle dans de nombreuses données hétérogènes et de les restituer de manière unifiée.

 

Fournissant, sur une recherche donnée (une lithologie, dans une région…), les résultats les plus pertinents de chaque base (monuments, pierres utilisées, pierres de remplacement, carrières d’origine, experts, plans…), l’outil peut réutiliser ces informations pour relancer des recherches vers des bases sans notion lithologique ou stratigraphique. Le résultat, affiché sur une page, synthétise l’ensemble.

Carrier : développement d’un accès simplifié aux données complexes

Carrier (lancé en 2011) a été construit autour de la problématique des données complexes à appréhender, et donc difficiles à exposer au travers d’un moteur de recherche. Il s’appuie sur les données combinées de deux bases sans lien direct (Monumat, référençant des carrières de pierres ornementales ; l’Observatoire des matériaux, référençant des sites de carrières, exploitants, produits, tonnages). Ce projet teste des solutions permettant aux utilisateurs d’exprimer simplement des requêtes embrassant toute la richesse de ces bases. Ainsi, par un travail préliminaire d’indexation et de construction assistée de requêtes, l’utilisateur est capable de trouver les carrières les plus proches produisant une pierre pouvant servir de remplacement sur un monument donné.

 

Cet usage nécessite : 1) l’exploitation d’un index gérant les relations entre les bases ; 2) la conception d’une ergonomie Web de recherche guidant l’utilisateur et 3) l’affichage de résultats compréhensibles. Carrier propose plusieurs éléments de réponse qui pourront, à terme, être réutilisés sur d’autres thématiques et projets.

Dernière mise à jour le 22.04.2013