Le Dictionnaire topographique. Une API pour les toponymes anciens français

poster / demo / art installation
Authorship
  1. 1. Vincent Jolivet

    École Nationale des Chartes - Université PSL

  2. 2. Julien Pilla

    École Nationale des Chartes - Université PSL

Work text
This plain text was ingested for the purpose of full-text search, not to preserve original formatting or readability. For the most complete copy, refer to the original conference program.


Un projet éditorial de 160 ans
Le
Dictionnaire topographique de la France est une ressource de premier plan pour les historiens et les toponymistes : il compile pour la France métropolitaine plus de 1 100 000 toponymes anciens attestés, datés et référencés. Entreprise éditoriale au long cours lancée en 1859 par Léopold Delisle, le
Dictionnaire topographique a pour mission de compiler tous les toponymes médiévaux et modernes de la France. En raison de l’ampleur de la tâche, on opta rapidement pour le principe d’un volume par département, le tout devant à terme – et en théorie – être unifié par un index général. Les débuts furent prometteurs : 19 dictionnaires parurent entre 1861 et 1884, dus principalement aux archivistes départementaux. Le mouvement se poursuivit à un rythme plus modéré, à raison de deux à quatre dictionnaires par décennie jusqu’aux années 1920, avant de connaître un net ralentissement avec la publication de seulement 4 volumes depuis les années 1950. Ce sont aujourd’hui 35 départements qui sont couverts, représentant plus du tiers du territoire national métropolitain.

Du papier au numérique
L’éditeur, pour revitaliser cette initiative savante, numérise depuis 2009 les différents volumes, en propose une édition numérique, et en distribue les sources XML. Cette restructuration XML de l’édition imprimée a été rendue possible par l’homogénéité des conventions éditoriales assez bien respectées par les nombreux contributeurs au fil des décennies. Le corpus des 35 volumes publiés est intégralement disponible depuis 2018. À cette occasion, une nouvelle application de consultation et de partage de la ressource est développée. Celle-ci n’est pas une simple édition numérique. Tirant parti du liage des données à plusieurs référentiels dont celui de l’INSEE, elle est conçue avec cette idée que la richesse des dictionnaires est loin d’être épuisée par leur publication papier et qu’elle doit rendre possible de nouvelles exploitations : l’index unifié et la géolocalisation des entrées permettent dorénavant de cartographier la densité de certains types de toponymes (par exemple les moulins et les châteaux) sur le territoire, et ce en diachronie. Grâce au moteur de recherche, les toponymistes peuvent étudier les toponymes selon leur suffixe ou bénéficier de la recherche floue, précieuse pour les contextes historiques de forte variation graphique. Il est aussi possible de lister l’ensemble des toponymes recensés sur une même commune.
L’application fournit des permaliens pour l’identification de ces toponymes historiques. Un service est en cours d’implémentation pour faciliter leur identification dans les éditions numériques des documents anciens. Surtout, la nouvelle application entend favoriser le partage de la donnée brute de manière à en rendre possible les réutilisations, via une API documentée et un service de recherche.

Une JSON:API pour le partage des données géohistoriques
Une API de consultation a été définie pour construire l’application Web de consultation, de recherche et de géolocalisation des données et pour permettre le partage des données en exposant différents services au public. Le choix de la spécification JSON:API améliore l’interopérabilité avec des services extérieurs et favorise la composition de documents avec des ressources liées : avec une requête unique, on peut récupérer l’ensemble des informations associées à un lieu ancien, tels que son type, ses coordonnées ou les toponymes liés. L’implémentation de la spécification s’abstrait du modèle de données sous-jacent qui s’en trouve plus facilement modifiable. Enfin, les fonctionnalités de recherche, également exposées via l’API, sont accessibles à des services extérieurs.
L’objectif de cette API est de favoriser les remplois de cette base de connaissance importante, mais aussi d’en poursuivre l’enrichissement en offrant aux chercheurs une interface pour corriger et enrichir le contenu au gré de leurs découvertes. Les éditeurs scientifiques ont l’habitude d’identifier les toponymes anciens dans l’apparat critique de leurs éditions. À défaut d’être accessible et standardisé ce travail de grande valeur est perdu : l’application doit permettre aux érudits d’enregistrer et de partager leur travail et ce faisant de contribuer à revitaliser l’entreprise éditoriale du
Dictionnaire topographique.

Le Poster vise à faire connaître cette ressource essentielle. Nous détaillerons les étapes de la constitution de la donnée (numérisation, restructuration, enrichissement et liage des données) et présenterons l’état d’une réflexion sur le partage et le liage des données géohistoriques, les méthodes et développements associés. Nous souhaitons pouvoir échanger avec les participants de la session sur leurs besoins et pratiques (identification des toponymes anciens, annotations de corpus textuels) afin d’évaluer la pertinence des choix d’implémentation, si la définition et la documentation de l’API sont conformes aux attentes des collègues qui souhaiteront développer des applications tierces.

If this content appears in violation of your intellectual property rights, or you see errors or omissions, please reach out to Scott B. Weingart to discuss removing or amending the materials.