Humanités numériques et patrimoine culturel

Sphinx-green-petit4

La création de ressources numériques, de modèles sémantiques pour les données du patrimoine culturel et de référentiels sur l’iconographie et la mythologie antiques notamment, est actuellement un axe majeur transversal aux divers projets de l’équipe LIMC. Cette dernière s’est engagée dès le début des années 2000 sur la voie du web sémantique, accentuant ainsi son implication dans les Humanités numériques amorcée avec l’informatisation de sa production scientifique en 1981.

En effet, 1981 est l’année de la création, par l’équipe française du LIMC, d’une base de données – un corpus électronique des objets figurés antiques étudiés par l’équipe (LIMC-icon) – et d’un vocabulaire contrôlé ayant évolué au fil des ans en un thésaurus multilingue (TheA).
Dès le début des années 2000, l’équipe s’est intéressée au web sémantique grâce à sa participation active au projet international CLAROS-The World of Art on the Semantic Web, pionner dans ce domaine. Cette orientation Humanités numériques est au cœur de l’évolution des données du LIMC et a pour finalité l’élévation de ces ressources numériques dans le Linked Open Data (Web de données liées, ouvertes). Dans ce but, et dans un esprit d’ouverture des données scientifiques, le LIMC partage et applique les pratiques et techniques du web sémantique à travers plusieurs programmes et réalisations.

écran d'accueil du site Web LIMC-France

♦ Les ressources numériques du LIMC dans les Humanités numériques

  • LIMC-France : les bases de connaissance LIMC-France (LIMC-icon, LIMC-biblio, LIMC-abrev) – librement accessibles sur le Web (http://limc-france.fr) – et le thésaurus TheA évoluent constamment, dans une volonté de dimension expérimentale, avec une attention portée à leur adaptabilité et à leur conformité aux standards documentaires et numériques.
    Le multilinguisme repose sur l’utilisation de l’ISO 639 et d’Unicode®. Les métadonnées des photos numériques de la photothèque sont renseignées selon le standard  IPTC / XMP.

    • Les données LIMC-icon structurées en CIDOC CRM et RDF, dans un triplestore : afin de démontrer la viabilité et l’intérêt de l’interopérabilité des données du patrimoine culturel et de l’élévation de celles-ci dans le Web de données (LOD), les données descriptives de LIMC-icon sont actuellement exportées – selon un modèle conceptuel construit sur la norme CIDOC CRM – dans un triplestore  (données en RDF) accessible via un « endpoint Sparql » qui propose à la fois une interface de requête en Sparql et un formulaire de requête traditionnel.
      Cette application expérimentale destinée au Web de données est une preuve de concept réunissant les données du LIMC, du CDLI et de la BDIC. Réalisée, tout comme le modèle conceptuel, en collaboration avec le programme ModRef (Modélisation, référentiels et culture numérique) du LabEx Les passés dans le présent, elle sera hébergée par la TGIR Huma-Num.
    • www.weblimc.org (en cours d’élaboration) : cet accès commun aux données LIMC-France & Digital-LIMC (Université de Bâle) est fondé sur les technologies du Web de données et la création du triplestore ModRef.
    • Le thésaurus TheA accessible en ligne : grâce aux outils et à l’hébergement mutualisés proposés par la TGIR Huma-Num, le thésaurus TheA est en cours de mise en ligne, via le logiciel Opentheso (CNRS-FR3747), pour faciliter les alignements avec d’autres vocabulaires de référence. Opentheso et TheA répondent aux standards SKOS & ISO 25964 (Thesauri…) ; le gazetteer (données géographiques) utilise WGS84 & WKT .
  • Callythea, un corpus de poésie hellénistique en TEI : cette édition électronique, réunissant texte original, traduction et commentaires de poésie hellénistique, est liée aux objets et images diffusés dans LIMC-icon via les URI des notices des deux ressources. Ses données sont nativement structurées en format TEI / Text Encoding Initiative (XML/TEI5). Hébergée sur la plateforme Telma (IRHT), elle a été réalisée dans le cadre de l’ANR CAIM (ANR-08-CREA-020).
  • Polyclès (en cours de mise en ligne) : prosopographie d’acteurs de la création artistique de l’époque hellénistique (programme LIMC ; hébergement TGIR Huma-Num). Les données sont actuellement structurées selon le Dublin Core (dcterms).

Logo du Web sémantique

♦ Collaborations pour la création de référentiels et de ressources en ligne

La mise en correspondance (mapping) des données produites par l’équipe du LIMC avec les standards pour l’interopérabilité des données du patrimoine culturel, la réalisation du triplestore et de son endpoint Sparql, ainsi que l’exposition de TheA, sont les étapes indispensables pour associer et aligner, dans le Web de données (LOD), les ressources numériques du LIMC avec d’autres données institutionnelles et proposer des référentiels au monde de la recherche et du patrimoine culturel, notamment dans le cadre des programmes suivants :

  • L’exposition virtuelle des objets antiques à figuration mythologique du Cabinet des Médailles de la BnF : le site Web de cette exposition – conçue dans le cadre du projet Corpus numérique du Cabinet des Médailles de la BnF (ObjMythArcheo) associant le LIMC et la BnF – est réalisé avec Omeka et les métadonnées sont hébergées dans Nakala, grâce à l’utilisation du pack Nakalona de la TGIR Huma-Num.
  • Kerameikos.org : ce projet international, porté l’American Numismatique Society, vise à réunir dans le LOD des ressources numériques sur la poterie en élaborant une ontologie et un vocabulaire tenant compte et restituant les pratiques des spécialistes de l’étude de la céramique. Le Beazley Archive d’Oxford, le British Museum, le J. Paul Getty Museum, l’Harvard Art Museum, l’Université de Virginia, l’Université Mary Washington (Virginia) participent à ce projet.
  • ONOMA : référentiel des acteurs historiques de la création artistique (programme HADOC,  Harmonisation des données culturelles, Ministère de la Culture et de la Communication).

Logo du site web ArcheoNum

♦ Partager les connaissances et les pratiques relatives aux données du patrimoine culturel dans les Humanités numériques

  • ArcheoNum – L’archéologie dans les humanités numériques : afin de partager ces approches innovantes avec la communauté de la recherche, A.-V. Szabados a créé le projet collectif ArcheoNum (ArScAn), en collaboration avec V. Fromageot-Laniepce. Les séances de ce programme de partage de connaissances, d’expériences et de réflexion, portent sur des aspects, pratiques et outils relatifs au Web sémantique, et plus particulièrement sur l’interopérabilité des données du patrimoine culturel. Ouvert également aux étudiants, ArcheoNum s’inscrit aussi dans une approche de formation.
    Organisées en corrélation avec l’actualité et les innovations dans le domaine des Humanités numériques, les séances déjà effectuées ont permis de traité des thèmes tels que le droit appliqué à la production scientifique et au patrimoine culturel ; l’adaptation des carnets de recherche aux pratiques des archéologues et des ethnologues ; les outils libres et institutionnels de gestion de thésaurus ; les ontologies et modèles sémantiques pour l’archéologie (conférence internationale CAA-2014) ; les métadonnées de l’image numérique et l’approche iiif pour l’interopérabilité des images numériques ; l’analyse multidimensionnelle des données qualitatives en archéologie ; le programme européen ARIADNE, ses approches et outils en ligne.Pour les informations sur les séances, voir le site Web ArcheoNum : http://archeonum.hypotheses.org/).
  • Session « Ontologies and Standards for improving Interoperability of Archaeological Data : From Models towards practical Experiences in various Contexts » de la conférence internationale CAA-2014 Paris (Computer Applications and Quantitative Methods in Archaeology), 24 avril, 2014 : cette session a rassemblé les spécialistes internationaux du Web de données appliqué à l’archéologie et aux données du patrimoine culturel.
    Pour accéder au programme et aux présentations : https://archeonum.hypotheses.org/346

 

Contact : anne-violaine.szabados@cnrs.fr

Bibliographie sélective :

  • Szabados, A.-V. 2010. « L’usage de normes pour l’interopérabilité des données sur l’Antiquité : l’exemple des outils documentaires du LIMC ». Poster présenté à la Journée d’études pour les professionnels de la BAP F en SHS, 25 novembre 2010, Paris. (http://www.cnrs.fr/inshs/recherche/…).
  • Szabados, A.-V. 2012. « Du système documentaire du LIMC au portail CLAROS. Interopérabilité et optimisation de l’information archéologique grâce à l’usage de normes ». Actes des Deuxièmes Journées Informatique et Archéologie de Paris – JIAP 2010 (Paris, 11-12 Juin 2010), p.11-25, Archeologia e calcolatori, Supplemento 3, 2012.
  • Szabados, A.-V., Letricot, R. 2012. « L’ontologie CIDOC CRM appliquée aux objets du patrimoine antique ». Communication aux 3e Journées Informatique et Archéologie de Paris – JIAP 2012 (Paris, 1-2 Juin 2012). [à paraître]
  • Linant de Bellefonds P., Szabados A.-V. 2012. « LIMC-France et Callythea, deux ressources numériques interactives », Communication à la conférence internationale Archivi digitali per la fortuna del mondo antico e della tradizione artistica, Pise, 3-4 décembre 2012. (http://www.youtube.com/watch?v=2KcNARBT-bU&list=PL4eX8mtGxkAk9quO-zeKVcf0DfUyIFuoM&index=4).