Huma-Num : Une infrastructure française pour les Sciences Humaines et Sociales. Stratégie, organisation et fonctionnement

paper, specified "long paper"
Authorship
  1. 1. Nicolas Larrousse

    Huma-Num - CNRS (Centre national de la recherche scientifique)

  2. 2. Olivier Baude

    Huma-Num - CNRS (Centre national de la recherche scientifique)

  3. 3. Adeline Joffres

    Huma-Num - CNRS (Centre national de la recherche scientifique)

  4. 4. Stéphane Pouyllau

    Huma-Num - CNRS (Centre national de la recherche scientifique)

Work text
This plain text was ingested for the purpose of full-text search, not to preserve original formatting or readability. For the most complete copy, refer to the original conference program.

Introduction
La recherche en sciences humaines et sociales vit un tournant numérique qui provoque une évolution sensible des pratiques de recherche.

Aujourd’hui, les chercheurs produisent

d’importants volumes de donnees numeriques et utilisent des outils specialises pour y acceder, les manipuler, les visualiser et les diffuser. Cela necessite d’associer ces grands volumes de donnees a des moyens technologiques qui se doivent d’etre stables et consequents. La maitrise de ce nouvel environnement doit s’appuyer sur le developpement de competences diversifiees et en constante evolution.

La mise en œuvre de cet ecosysteme ne peut plus être réalisée avec les moyens dont disposent les chercheurs individuellement ou meme a l’echelle d’une equipe de recherche. Une infrastructure, au sens élargi du terme, est nécessaire pour etre à meme de fournir et mutualiser differents services et d’accompagner les equipes de recherche tout au long de leurs projets numeriques.

La TGIR Huma-Num est une infrastructure de recherche française au service de la recherche en sciences humaines et sociales. Elle est batie sur une structure originale destinee a proposer des services dedies a la production et a la reutilisation de donnees numeriques mais aussi a favoriser et accompagner ¡^mergence d’outils et de bonnes pratiques issus des communautes scientifiques des sciences humaines et sociales. Enfin, Huma-Num est etroitement associee a la construction d’infrastructures europeennes permettant tout autant rechange et la valorisation de services que le renforcement de reseaux d’expertises.

Notre presentation s’articule autour des trois grands axes developpes par Huma-Num pour repondre aux besoins de la recherche en sciences humaines et sociales.

• La creation et le soutien de consortiums, cercles d’expertise disciplinaires ou non, permettant une concertation collective par les communautes ;

• Le developpement de services technologiques destines a l’outillage des donnees de la recherche ;

• L’ouverture à l’international par la participation a des projets d’infrastructures Europeennes mais aussi par des echanges bilateraux plus cibles.

Les consortiums reunissent des acteurs issus de structures et de projets de recherche divers, autour de thematiques, d’objets ou de methodes communs. L’objectif est de favoriser l’appropriation des dispositifs numeriques par ces communautes et ainsi de créer des synergies en lien avec les services de Huma-Num. Le spectre des activites de ces consortiums est large, allant, par exemple, de la creation d’applications jusqu’a la definition de schema de metadonnees, en passant par la production de guides de bonnes pratiques associees a des formations specifiques. Actuellement, Huma-Num soutient les activites de huit consortiums, principalement disciplinaires, qui s’articulent avec le reseau des Maisons des Sciences de l’Homme (reseau geographiquement reparti sur les campus universitaires et du CNRS en France metropolitaine) et dont certains collaborent a des projets europeens.

Les services gerés directement par l’equipe de la TGIR Huma-Num sont destines a fournir des outils tout au long du cycle de vie des donnees : de la production de donnees brutes jusqu’a leur preservation apres traitement. Pour pouvoir proposer des ressources bien dimensionnees et adaptees, Huma-Num n’a pas crée

son propre centre de données, mais s’appuie sur les compétences et les moyens de centres de calcul nationaux français.

L’un des objectifs principaux est de mettre en œuvre un cadre d’outils permettant aux chercheurs d’exploiter au mieux leurs donnees mais surtout de les amener a les partager et, in fine, a les preserver. Il s’agit de permettre l’appropriation par les chercheurs de methodes et services numeriques au cœur des processus de recherche scientifique. Les technologies d’interoperabilite, en particulier celles proposees par le Web Semantique, sont au cœur de cette chaine de traitement permettant des echanges fluides entre les differentes briques qui la composent. Le Web Semantique permet aussi de decloisonner les donnees de la recherche par l’utilisation de réferentiels et normes communs.

Ces outils appuient une demarche generale d’accompagnement des utilisateurs. Ainsi, lors d’une demande d’utilisation, Huma-Num effectue de maniere systematique une sensibilisation a la perennisation, a la curation, au partage des donnees et aux enjeux de la normalisation.

Ce point est crucial dans le fonctionnement de cette grille de services qui doit aussi permettre la montee en competence des communautes.

Les activites internationales de Huma-Num sont de differente nature mais elles visent essentiellement a valoriser les dispositifs français d’infrastructure et de la recherche française et a construire un dialogue scientifique et des dispositifs depassant les frontieres nationales. Huma-Num porte ainsi la participation française a des ERICs (European Research Infrastructure Consortium), disciplinaires comme CLARIN depuis 2017, ou a vocation plus large pour les Sciences Humaines en incluant le domaine culturel comme DARIAH depuis sa creation en 2014. Ces ERICs, établis sur une longue durée, ne sont pas financés directement par la Commission Europeenne mais par les Etats participants. L’originalite du budget de l’ERIC DARIAH est que 90% de celui-ci est constituee de contributions « en nature » : l’objectif etant de ne pas dupliquer a l’echelle europeenne des services qui existeraient deja au niveau national. Le role d’Huma-Num est donc d’identifier les services et expertises nationaux, en particulier ceux en provenance des consortiums et des grands operateurs français de l’information scientifique et technique et du patrimoine culturel, et d’en faire un ensemble coherent capable d’integrer et de completer l’offre europeenne constituee par les partenaires. En parallele, Huma-Num participe a des projets a plus court terme destines à soutenir la construction de ces grandes infrastructures et qui sont, eux, finances par la Commission Europeenne (dans le cadre des programmes H2020).

Enfin, hors Europe, Huma-Num maintient des liens étroits avec les mondes francophones (e.g. Québec) et hispanophones (e.g. Amerique du Sud). La aussi, l’objectif est de valoriser les services d'Huma-Num ainsi que ceux issus des communautes nationales et de beneficier en retour d’échanges d’expertises, notamment dans les domaines de la préservation et de la curation de donnees issues de la recherche en Sciences Humaines et Sociales.

La TGIR Huma-Num a elaboré sa definition de services technologiques autour du cycle de vie des donnees. Cette présentation vise a présenter, a partir d’une demarche réflexive, les services d’Huma-Num et la pertinence de leur articulation avec les autres composantes de l’infrastructure que sont les consortiums ainsi que leur projection au niveau international.

En effet, Huma-Num propose des outils adaptes a chaque etape du cycle des donnees de la recherche :

• Du simple stockage de sauvegarde au debut du projet ; Suivant le taux prévisible d’utilisation des donnees, il est propose plusieurs solutions technologiques : les donnees « froides » (i.e. peu utilisees) sont gerées a moindre couts sur des stockages distribues alors que les donnees « chaudes » sont mises a disposition via des stockages performants de type NAS ;

• Des outils de traitement des donnees. Ceux-ci sont mutualises comme par exemple des logiciels de SIG (Systeme d’information Geographique) qui seraient trop couteux a acheter pour une utilisation ponctuelle par un projet. Pour ces operations de traitements, la TGIR met a disposition une grande puissance de calcul ;

• De l’hebergement Web pour présenter les donnees et permettre leur partage et leur acces ainsi qu’un travail collaboratif. Pour des besoins plus specifiques des Machines Virtuelles sont mises a disposition afin d’offrir une grande souplesse d’exploitation ;

• Enfin, et c’est la l’originalite de

l’infrastructure, il est propose un ensemble de services qui permet la diffusion, la citation, la perennisation et surtout la promotion de la reutilisation de ces donnees:

o NAKALA pour stocker des données documentées et les partager, associé a NAKALONA pour les editorialiser

o ISIDORE pour diffuser ces metadonnees en les enrichissant, les classifiant et les positionnant dans le LOD (Linked Open Data)

Pour les données qui le necessitent (e.g. des donnees de type patrimonial), un service de perennisation a long terme (plus de 20 ans) en partenariat avec le CINES (http://cines.fr) dont c’est la mission, complete l’offre.

La pertinence des demandes d’ouverture de services est evaluee par un comite interne a Huma-Num qui s’appuie egalement sur les recommandations de son conseil scientifique.

Cet ensemble de services peut etre visualise de manière synthétique à cette adresse:

http://www.huma-num.fr/services-et-outils

Par ses differentes composantes, la TGIR Huma-Num s’emploie a developper des réponses aux besoins nouveaux des differents acteurs de la recherche provoques par l’utilisation du numerique. Le fil rouge qui les relie est de pouvoir rendre possibles de nouvelles recherches dans le domaine des sciences humaines et sociales et, au-dela, de constituer de maniere dynamique un savoir partage.

If this content appears in violation of your intellectual property rights, or you see errors or omissions, please reach out to Scott B. Weingart to discuss removing or amending the materials.

Conference Info

Complete

ADHO - 2017
"Access/Accès"

Hosted at McGill University, Université de Montréal

Montréal, Canada

Aug. 8, 2017 - Aug. 11, 2017

438 works by 962 authors indexed

Series: ADHO (12)

Organizers: ADHO