Canada Research Chair on digital textualities / Chaire de recherche du Canada en écritures numériques
Canada Research Chair on digital textualities / Chaire de recherche du Canada en écritures numériques
Canada Research Chair on digital textualities / Chaire de recherche du Canada en écritures numériques
Canada Research Chair on digital textualities / Chaire de recherche du Canada en écritures numériques
Canada Research Chair on digital textualities / Chaire de recherche du Canada en écritures numériques
Canada Research Chair on digital textualities / Chaire de recherche du Canada en écritures numériques
Dans cette présentation, nous nous proposons d'analyser la chaîne éditoriale de production et de diffusion des revues savantes en Sciences humaines francophones, en nous appuyant sur le corpus diffusé par la plateforme Érudit. Nous montrerons les limites et les problèmes que présente une telle chaîne éditoriale, pensée à la fin des années 1990, et qui n'a depuis fait l'objet que de très peu de modifications majeures et nous présenterons l'éditeur de texte Stylo, la solution proposée à ces problèmes par l'équipe de la CRC sur les écritures numériques.
Absolument fondamentale en vue d'une diffusion numérique, la structuration des documents et leur balisage sont actuellement reportés à la fin du processus éditorial (l'encodage XML est pris en charge par l'équipe d'Érudit) quand en réalité ceux-ci devraient être envisagés dès la production (par l'auteur lui-même, dès la première révision des articles). À cet égard, il semblerait urgent et logique de réintégrer le travail de balisage et de structuration en début de chaîne.
Un tel objectif se heurte cependant au manque de compétences suffisantes de la part des auteurs : les pratiques d'écriture, telles qu'elles existent aujourd'hui, demandent en effet aux chercheurs de traduire leurs connaissances sur le sens des contenus (ce qu'est une référence ou un titre, l'importance d'un mot, etc.) en simples marques graphiques (italiques, gras, type de guillemets, etc.). Or des erreurs se glissent régulièrement au cours de ce processus du fait du recours à des solutions qui ne sont ni tout à fait spécifiques ni tout à fait explicites, soit finalement à faible valeur de scientificité.
Par ailleurs, ce texte formaté graphiquement est actuellement retravaillé en bout de chaîne par Érudit qui cherche à réinterpréter le sens du texte, à partir de ces indices graphiques. Érudit entreprend alors de transformer ces signes graphiques en balises sémantiques : cette espèce de rétro-programmation implique une perte de temps faramineuse ainsi qu'une potentielle perte d'informations problématique d'un point de vue scientifique.
Pour y remédier, notre équipe est en train de développer l'éditeur de texte Stylo. La philosophie de Stylo consiste à remettre dans les mains des chercheurs la gestion du balisage en partant cette fois-ci de leurs compétences, qui sont des compétences sémantiques plutôt que graphiques. Conçu sur le principe d'un éditeur WYSYWYM (what you see is what you mean), Stylo a le potentiel de changer l'ensemble de la chaîne de production des contenus dans le domaine des revues savantes en Sciences Humaines, en proposant une interface uniformisée et sans perte de données, depuis la rédaction jusqu'à la diffusion, en passant par l'évaluation, la correction et l'édition.
L'éditeur propose aux auteurs un environnement d'écriture très simple mais permettant un enrichissement sémantique à travers des fonctionnalités de balisage léger mais spécifique au travail d'auteur. Le chercheur a ainsi la possibilité de baliser l'ensemble des informations qu'il produit de façon sémantique (titres, sous-titres, références bibliographiques, notes, index), simplement en sélectionnant les éléments, en leur appliquant des styles préprogrammés, ou selon les compétences de l'auteur, en utilisant le format markdown.
La suite de la chaîne éditoriale (évaluation, édition,
diffusion) est assurée au sein du même outil, permettant aux producteurs de contenus - les éditeurs de la revue ou de la plateforme de diffusion, ou encore directement les chercheurs eux-mêmes - d'enrichir le texte en sélectionnant et ajoutant des métadonnées (mots-clés, nom de l'auteur, nom de la revue, etc.) et en les alignant avec des autorités.
Les métadonnées, étant alignées, pourront être facilement mises en relation avec d'autres contenus existants (traduction automatique en plusieurs langues, notamment, en se basant par exemple sur les alignements des vocabulaires RAMEAU de la Bnf et LCSH de la Library of Congress). Grâce à l'alignement avec des autorités, les contenus créés via Stylo pourront par ailleurs être mis en relation avec n'importe quels autres contenus - par exemple via un moissonnage qui interroge les autorités, ou encore être mieux indexés par les moteurs de recherche spécialisés.
N'importe quelle plateforme de diffusion peut ainsi exploiter les contenus produits par Stylo. La brique logicielle centrale communiquera via une API avec plusieurs plateformes en fournissant des métadonnées très riches, sans que l'enrichissement soit réalisé par le diffuseur ou l'exploitant final - puisque pris en charge directement par le producteur.
Dans l'esprit des éditeurs WYSIWYM, le formatage graphique du contenu est automatiquement effectué lors de l'export, en s'appuyant sur des modèles programmables et intégrés à la chaîne éditoriale des revues et des plateformes de diffusion (Erudit.ca, Opene-dition.org).
1. Ces exports pourront être de plusieurs types selon la diffusion visée :
2. des fichiers XML selon les schémas sélectionnés (Erudit, TEI, etc.)
3. des fichiers HTML pour publication directe sur des CMS (grâce à des API)
4. des fichiers print (.pdf) stylés selon des modèles programmables.
L'éditeur pourra être utilisé pour différents types de contenus, notamment :
1. les articles de revues
2. les monographies
3. les mémoires et les thèses
4. les billets de blogue de recherche
Au moment de cette soumission, nous disposons d'un prototype de l'éditeur, dont une version stable est prévue pour le mois d'avril 2017.
Bibliographie
Bachimont, B. (2007). “Nouvelles tendances applicatives : de l'indexation à l'éditorialisation.” In L'indexation multimédia. Paris: Hermès.
Doueihi, M. (2011). Digital Cultures. Harvard University Press.
Floridi, L. (2014). The 4th Revolution: How the Infosphere Is Reshaping Human Reality. First edition. New York; Oxford : Oxford University Press.
Guyot, B. (2004). Sciences de l'information et activité professionnelle. Vol. 38. C.N.R.S. Editions. http://www.cairn.info/resume.php?ID_ARTI-
CLE=HERM_038_0038.
Vitali-Rosati, M. (2015). « An editor for academic papers (xml, html, md, TeX, pdf and if you really need it rtf) », Culture numérique. http://blog.sens-public.org/marcel-lovitalirosati /an-editor-for-academic-papers-xml-html-md-tex-pdf-and-if-you-really-need-it-rtf/.
If this content appears in violation of your intellectual property rights, or you see errors or omissions, please reach out to Scott B. Weingart to discuss removing or amending the materials.
Complete
Hosted at McGill University, Université de Montréal
Montréal, Canada
Aug. 8, 2017 - Aug. 11, 2017
438 works by 962 authors indexed
Conference website: https://dh2017.adho.org/
References: http://web.archive.org/web/20170802132745/https://www.conftool.pro/dh2017/sessions.php
Series: ADHO (12)
Organizers: ADHO