L’Accès vu comme une Contrainte et un Défi : le processus de naissance d’une base de données

poster / demo / art installation
Authorship
  1. 1. Pinelopi Skarsouli

    CNRS (Centre national de la recherche scientifique)

  2. 2. Dina Bacalexi

    CNRS (Centre national de la recherche scientifique)

Work text
This plain text was ingested for the purpose of full-text search, not to preserve original formatting or readability. For the most complete copy, refer to the original conference program.

Une base de données organise la connaissance en vue de son utilisation par un public donne. Cette definition trop rapide et lacunaire ne tient pas compte de la complexite du processus de création, ni de la véritable nature d’une base numerique, qui, pour nous, doit etre le fruit d’un dialogue entre la partie scientifique et la partie technique du projet. Nous allons etudier, pour deux bases antiquisantes, le processus de passage d’une approche textuelle, libre de toute contrainte, a une autre basee sur la structuration, c’est-à-dire la transcription en structuration formelle des decisions prises par les analystes des textes antiques.

Dans ces deux cas, un nouvel acces, résultat de la restructuration des outils, vise un public nouveau tout en servant mieux l’ancien :

1) l’abandon d’un modele conçu pour l’imprime, ou la recension annuelle des donnees pour produire le volume papier de l'Année Philologique, accompagne d’une transformation en site web, constituait pendant des decennies le but recherche : l’objectif etait un changement total du contenu et de la structure, pour obtenir une veritable base de donnees, tout a fait differente (IPhiS, la nouvelle base philologique en construction).

2) la transformation d’un modele sans volume papier paru, qui n’etait pas pour autant une construction « native numerique » mais un simple export html periodique d’un ensemble de donnees thematiques : l’objectif etait la reprise des anciennes donnees avec une modeli-sation nouvelle permettant d’obtenir une nouvelle base, qui continuerait l’ancienne seulement en ce qui concerne le contenu (le cas du Répertoire des sources philosophiques an

tiques).

La question de l’acces libre aux donnees s’est posee à nous comme une contrainte. Notre travail d’an-tiquisants analystes de sources grecques et latines philologiques ou philosophiques (au sens large des termes) a croise celui des developpeurs d’applications numeriques quand nous avons commence a transformer les deux outils bibliographiques précites. Il existe plusieurs façons d’envisager la permeabilite et l’articulation scientifique-technique ; nous étudierons comment le dialogue permanent direct permet un meilleur acces aux donnees d’une base.

Quand un modele a fait ses preuves depuis prés de 80 ans et que sa notoriete est installe dans la communauté, la difficulte est d’imposer un modele nouveau quant a la pertinence scientifique et le traitement de l’information. La contrainte est double : passer d’un logiciel proprietaire (4D) dont l’adaptation convenait tout a fait a la bibliographie papier et a son export en ligne, a une solution de logiciel libre qui apporterait cependant la meme richesse et finesse d’indexation que 4D et créerait une véritable base de donnees numerique. La question ne concernait pas seulement le de-veloppement de l’outil nouveau, mais aussi le type des donnees a implementer dans la base. Notre questionnement concernait aussi le fait meme de rendre la base accessible librement sur le web : au moment de la proliferation de l’information grâce aux moteurs de recherche generalistes du type Google scholar, quelle serait la « plus-value » d’une enieme base ? C’est pourquoi nous avons commence a réflechir comment les entrées de la base pourraient pointer vers des donnees textuelles litteraires exterieures en XML/TEI, afin que nos bases ne soient pas simplement des thesauri bibliographiques riches et bien ordonnees, mais sans lien avec les sources qu’elles sont censees analyser. Cette question est pour l’instant pour nous au stade de la reflexion theorique.

La liberte d’acces, dans le cadre des disciplines rares comme les nôtres, pose la question de la protection contre le copiage, le plagiat, l’imitation et donc l’appropriation de notre travail. C’est pourquoi, des le debut du projet, il est important de choisir une licence adaptee, par exemple de la famille Creative Commons.

Il faut aussi envisager l'accessibilité effective des données via l’interface utilisateur et le respect des standards du web.

Nous constatons trop souvent que les bases de don-nees, sites collaboratifs, plateformes, editions etc. emanent de programmes limites dans le temps, au financement et au personnel précaire, ce qui impacte la realisation des projets dans les delais impartis. Or, si ces bases repondent à une demande d’acces à des don-nees fiables et de qualite contrairement à la masse in-controlee offerte par les moteurs generalistes du web, elles ont vocation à durer et ont besoin d’une mise à jour réguliere de leur contenu et de leur infrastructure logicielle pour remplir leur mission. Les changements de technologie (internes ou imposes par l’ecosysteme) peuvent comporter des risques pour les projets et leurs utilisateurs finaux. La disparition des outils entraîne souvent celle du savoir et du savoir-faire des personnels.

La necessite d’obeir aux injonctions du court terme impacte le travail de renouvellement des anciennes bases : les delais de transformation sont plus longs que prevu, puisqu’il faut d’abord passer par une expression de nouveaux besoins et ensuite par une modelisa-tion tenant compte des choix scientifiques et traduisant ceux-ci en solutions techniques ; il faut ensuite experimenter, adapter, affiner. Un tel fonctionnement est à l’oppose d’une demande de solution rapide cles en main.

L’implémentation des notices dans une base en flux continu sur le web (en vue de leur moissonnage par les moteurs de recherche en temps reel), le rêve d’exhaus-tivite, contribuent à alimenter l’idee de liberte totale individuelle qui va à l’encontre du mode de travail collectif. Le risque est d’instaurer une nouvelle forme de dependance et de contrôle generalise, voire deceleration des cadences et de fin programmee de toute verification de la pertinence scientifique. C’est tout à fait different d’une base de donnees participative et basee sur la contribution de la communaute.

Le travail sur le contenu d’une base depend aussi de l’elaboration d’un cahier de charges, de la modelisa-tion des donnees (qui definit à son tour le type d’acces aux donnees dans l’immediat mais aussi dans l’avenir), des formulaires permettant de la remplir, de son interface de consultation et de la constitution d’une com-munaute d’utilisateurs. La question est la (restructuration et la (re)présentation des donnees sous une nouvelle forme en ligne, qui tienne compte des standards actuels (libre acces, interoperabilite etc.). La normalisation des donnees et la reduction de la redondance de l’information sont des gages d’une base de donnees pleinement accessible et exploitable par ses utilisateurs.

Bibliography

Bénel, A. 2014. “Quelle interdisciplinarité pour les ‘Humanités numériques’?” Les Cahiers du numérique 10/4: 103132. http://www.cairn.info/revue-les-cahiers-du-nu-

merique-2014-4-page-103.htm

Berra, A. 2015. “Pour une histoire des humanités numériques”, Critique 8 (n° 819-820): 613-626.

http://www.cairn.info/revue-critique-2015-8-page-

613.htm

Burnard, L. 2012. “Du literary and linguistic computing aux digital humanities: retour sur 40 ans de relations entre sciences humaines et informatique” in Read/Write Book: une introduction aux humanités numériques, Pierre Mourner (dir.), Marseille. http: //books.openedi-

tion.org/oep/242

Clivaz, Cl., Dilley, P. and Hamidovic, D. ed. 2016. (in collaboration with A. Thromas), Ancient Worlds in Digital Culture, Leiden: Boston.

Crane, G., Seales, B. and Terras, M. 2009. “Cyberinfrastructure for Classical Philology”. Digital Humanities Quarterly 3/1 www.digitalhumani-

ties.org/dhq/vol/3/l/000023/000023.html.

Flanders, J. 2009. “The Productive Unease of 21st-century Digital Scholarship.” Digital Humanities Quarterly 3/3 www.digitalhumani-

ties.org/dhq/vol/3/3/000055/000055.html.

Le Deuff, O. ed. 2014. Le temps des humanités digitales. La mutation des sciences humaines et sociales, Limoges.

If this content appears in violation of your intellectual property rights, or you see errors or omissions, please reach out to Scott B. Weingart to discuss removing or amending the materials.