Genèse du projet CArGOS

De cargoswiki

Le Contexte de la TGIR Huma-Num

Le contexte de la TGIR Huma-Num

Le projet de géocatalogue CArGOS (CAtalogue de données GéOgraphiques pour les Sciences Humaines et Sociales) fait suite au projet ArchaeDyn qui mobilise des équipes d’archéologues autour de la problématique de la « Dynamique spatiale des territoires de la Préhistoire au Moyen Age » [1].

Dans le cadre de l’Agence Nationale de la Recherche (ANR) ArchaeDyn (programme collectif pluri-institutionnel), une plateforme de recherche coopérative a vu le jour, propre à mettre en évidence des métadonnées sur des données géographiques relatives aux dynamiques socio-environnementales et territoriales.

Initialement prévue pour gérer des bases de données au sein des Maison des Sciences de l’Homme (MSH) de Dijon et de Besançon, cette plateforme a été élargie au niveau national dans le cadre de la Très Grande Infrastructure de Recherche (TGIR) sur les Humanités Numériques : il s’agit du présent géocatalogue CArGOS développé à partir de l’application GeoSource.

La TGIR Huma-Num vise à développer des infrastructures de stockage, de gestion et de mutualisation de données numériques en Sciences Humaines et Sociales (SHS). De fait, CArGOS s’inscrit dans cette optique puisqu’il s’adresse à des organisations SHS travaillant sur des données numériques géoréférencées. Il permet de diffuser et de partager une information au niveau national, de la « localiser » tout en conservant une gestion décentralisée.

Le respect des normes

Le géocatalogue CArGOS devant fédérer à terme de multiples institutions au niveau national, il était nécessaire de mettre en application des modèles de saisie répondant à des normes communes. Il existe deux référentiels qui concernent les données géographiques : les normes ISO (pour la structuration de champs génériques) et les normes INSPIRE (pour les contraintes légales et la normalisation de champs particuliers).

Les normes ISO

Les normes de l’Organisation Internationale de Normalisation ou ISO génère un référentiel commun proposant des solutions techniques et commerciales.

Pour ce qui a trait à l’information géographique, il s’agit des thèmes classés sous la dénomination « ISO 191xx ». Au sujet de la diffusion et de l’échange des métadonnées, deux thèmes nous concernent : la norme ISO 19115 pour le stockage des données et la norme 19139 pour l’échange et l’interopérabilité.

Les normes INSPIRE

INSPIRE est une Directive élaborée par la Direction générale de l'environnement de la Commission européenne, visant à établir en Europe, une infrastructure de données géographiques pour assurer l’interopérabilité entre bases de données, et faciliter la diffusion, la disponibilité, l'utilisation et la réutilisation de l’information géographique.

Répondre aux normes INSPIRE c’est mettre à disposition des données conformes à des spécifications techniques harmonisées. Cela n’impose donc pas de collecter de nouvelles données mais d’entretenir de manière cohérente des données géographiques et de les partager, quelque soient les échelles de collecte et de partage.

Le recours à l’application GeoSource

Dans le cadre de l’application CArGOS, il fallait donc intégrer diverses contraintes techniques :

  • Etre conforme avec les normes et standards liés aux métadonnées et permettre d’exporter ces fiches de métadonnées en fichiers XML ;
  • Possibilité d’utiliser des champs spécifiques SHS ;
  • Permettre un développement en vue de faire communiquer ce géocatalogue avec une application tierce (comme ArchaeOres) pour éviter une double saisie de certaines informations.

Pour ce faire, différentes applications de catalogage de métadonnées, libre de droit, ont été testées (en particulier MDWEB, GeoNetwork et GeoSource). Le choix a porté sur GeoSource puisqu’il intègre la directive européenne INSPIRE et implémente le profil français de la norme EN-ISO 19115-2005 et sa déclinaison en xml (ISO 19139).

GeoSource se base sur GeoNetwork. Il s’agit d’une solution stable, fonctionnelle depuis 2010. Outil « simple » de catalogage de métadonnées concernant des données ou des services, il présente une maintenance aisée, un support à long terme et une interface graphique fonctionnelle. Des développements ont été effectués pour personnaliser et faciliter l’ergonomie de la plateforme, optimiser les échanges avec d’autres serveurs de données.

Présentation de la structure CArGOS : les Vues et les Sections

GeoSource présente à l’origine nombre de rubriques. Un travail de personnalisation de l’interface a été réalisé afin de transformer un outil d’expert en une application « plus accessible » pour un public non averti.

Il a donc été décidé de créer une vue particulière, la Vue « CArGOS ».

Cette Vue se décompose en plusieurs sections. Ces sections ont été limitées afin de ne conserver que les champs conformes ISO et INSPIRE et les champs optionnels propres à l’étude SHS.

Cinq sections demeurent : Identification, Qualité de la donnée, Contexte scientifique, Information Spatiale, Accès aux données et Métadonnées. Ces sections sont présentes dans l’onglet de la vue principale, mais ont également été réparties dans des onglets individuels afin de faciliter la saisie des données.

Onglets d'une fiche de métadonnées CArGOS

Notion de thesaurus

Liste de valeurs
Accès au thésaurus

Les sections comportent des champs qui leur sont propres. Certains champs sont libres de commentaire tandis que d’autres doivent être saisis à partir de listes de valeur pour être conformes aux normes ISO et INSPIRE. C’est là qu’interviennent les notions de listes de valeur et de thesaurus (liste organisée de termes liés à un domaine de connaissance).

Les listes de valeur proposent des termes qui doivent être saisis, alors que d’autres champs peuvent être remplis au moyen de mots-clés regroupés dans des thesaurus accessibles via le bouton "Jumelles". L’accès à ces thesaurus ne contraint donc pas l’utilisateur et permet de caractériser au mieux la donnée.

Les thesaurus présents dans l’application figuraient initialement dans l’application pour coller aux normes INSPIRE (inspire-themes, gemet, ...) ou aux exigences GeoSource (Département, Environnement, …).

Pour tendre au plus près des problématiques SHS, il est possible de rajouter des thesaurus propres à chaque institution. Par exemple, trois thesaurus liés au domaine de l’archéologie ont été ajoutés : les thesauri Sujets et Chronologie (identique aux thésauri PACTOLS du réseau FrantiQ), et le thesaurus Disciplines (correspondant au domaine HAL - SHS).

Cependant, il est important de savoir qu’il est possible d’intégrer d’autres thesaurus, propres à une institution ou une problématique de recherche.

Au-delà de l’outil-technique qui optimise la saisie, l’accès et la diffusion de données spatiales, le géocatalogue CArGOS constitue un biais pour promouvoir l’information géographique puisqu’il fournit un outil interopérable, adaptable aux besoins de chaque unité de la communauté SHS.

En conséquence, en plus d’être un outil de gestion de services et institutions, CArGOS est à présent un outil de communication, de mutualisation et de connaissance pour la communauté scientifique.