Université de Montréal
Université de Montréal
Université de Montréal
Introduction
Cet article présente les résultats d'une recherche dans le cadre de laquelle nous nous sommes intéressés à l'évolution thématique de l'art contemporain dans les centres d'artistes autogérés du Québec. Nous dressons un portrait du milieu de l'art et de son discours en analysant automatiquement un ensemble de textes d'expositions. Notre approche repose sur des techniques automatisées de fouilles de textes. Notre objectif est donc de cartographier l'évolution des thématiques abordées dans le discours en art contemporain.
Notre approche s'inspire de la notion de distant reading développée par Franco Moretti. Selon Moretti, l'analyse des textes devrait être effectuée non pas sur une sélection d'ouvrages (le “canon”), mais sur l'ensemble le plus exhaustif possible de documents. Un échantillon de documents trop limité ou trop spécifique risque d'engendrer une perte d'informations précieuses.
Dans le domaine des arts, K. Bender s'est inspiré des travaux de Moretti afin de développer la théorie du distant viewing. Appliqué en histoire de l'art où les monographies se concentrent souvent sur les grands artistes et aux grandes oeuvres, il importe de développer, selon Bender, un “regard” permettant de saisir et d'analyser un très grand ensemble d'oeuvres d'artistes. Bien qu'il existe des techniques informatiques permettant d'analyser des images et en extraire des mots-clés descriptifs, ces techniques ne font qu'une description visuelle de l'image.
L'image ou l'oeuvre d'art, qu'elle soit figurative ou abstraite, ne se décode pas simplement. L'art visuel nécessite une analyse qui ne se limite pas au niveau descriptif. Interpréter une oeuvre d'art nécessite à priori certaines connaissances, notamment sur le travail et la démarche de l'artiste, le contexte socio-historique de l'oeuvre ou sur l'histoire et la théorie de l'art. Dans ce contexte, le texte d'exposition constitue un médium riche à exploiter pour extraire de l'information sur les oeuvres.
Le texte d'exposition
Les textes d'exposition en art ont comme objectif de situer et de contextualiser les oeuvres. Ils permettent une meilleure compréhension des oeuvres, du processus créatif de l'artiste, des thèmes, ainsi que des questionnements et des idées évoqués dans les expositions. Dans ce contexte, l'utilisation de techniques de fouille de textes, et plus spécifiquement de modélisation thématique (Topic Modelling) (Blei et Lafferty, 2009), permet d'extraire automatiquement les thématiques à partir de textes d'exposition qui n'auraient pu être extraites automatiquement à partir du contenu visuel et qui, à grande échelle, seraient beaucoup difficiles à identifier manuellement. En analysant tous les textes d'expositions disponibles pour une période donnée, nous pouvons poser un regard différent sur le discours en art. L'application de la modélisation thématique sur des textes d'exposition permet, en effet, d'extraire et de structurer automatiquement les principaux thèmes d'un corpus et d'en décrire le vocabulaire spécifique, en plus de permettre la classification d'oeuvres thématiquement comparables. (indépendamment de leur qualités visuelles).
Modélisation thématique et Artspeak
Le langage propre au milieu de l'art contemporain, parfois appelé le Artspeak ou International Art English (Levine et Rule, 2013), peut être difficile à décoder pour les non-initiés. Il a cependant comme qualité de permettre l'expression d'idées et de concepts abstraits propres à l'art contemporain, afin de lexicaliser la complexité des oeuvres. Comme le mentionne Levine, “IAE is about trying to create a more sensitive language, acknowledging the realities of how things [made by artists] work.”
La modélisation thématique la complexité des textes ou au niveau d'abstraction des phrases. Il permet, par simple calcul de distribution des mots, de regrouper des textes portant sur des thématiques communes. La modélisation thématique est fréquemment réalisée par l'algorithme LDA (Latent Direchlet Allocation), développé David M. Blei, Andrew Ng et Michael
I. Jordan en 2003. Bien qu'il ait été développé, il y a plusieurs années, cette algorithme fait l'objet d'un nombre croissant d'utilisation dans le traitement des textes en humanités numériques (Graham, Milligan et Weingart, 2016). Le principe qui sous-tend cet algorithme est qu'un corpus de textes est composé de nombreux thèmes (“topics”) latents; ces thèmes étant exprimés par les différents mots qui le composent. Les thèmes sont donc des regroupements de mots effectués sur la base d'un calcul de probabilité (bayésienne). Au niveau individuel, un document est composé d'un nombre k de thèmes, lesquelssont composés d'un nombre x de mots représentés selon différentes proportions. Au niveau macro (au niveau du corpus en entier), tous les documents d'une collection partagent les mêmes thèmes. L'algorithme LDA présuppose donc l'existence des thèmes latents qui n'apparaissent pas explicitement dans les documents. Ce principe évoque ainsi l'idée d'une structure cachée du document qui nous permet de dégager une structure de mots sur la base de leur proximité thématique. Les mots du corpus sont tous regroupés dans différents thèmes, tout en ayant la possibilité de se retrouver dans plus d'un thème à la fois.
Expérimentation
À partir d'une liste exhaustive de galeries d'art membres du RCAAQ (Regroupement des centres d'artistes autogérés du Québec), nous avons constitué un corpus composé de tous les textes d'expositions disponibles sur les sites Web des centres d'artistes (nous définissons ici “exposition” de manière peu restrictive. Il peut donc s'agir de performances, d'événements hors site ou d'expositions individuelles ou collectives). Un total de 3 867 textes d'expositions ont ainsi été trouvés en ligne, datant de 1973 à 2016 et provenant de 49 centres d'artistes autogérés différents. Les données ont été soumis à un processus de modélisation thématique dans l'application Mallet.
Divers prétraitements ont été appliqués au corpus initial afin de n'en retenir que le vocabulaire spécialisé en art (suppression des mots fonctionnels, filtrage par seuils statistiques, etc.). Par la suite, le corpus a été soumis à l'algorithme LDA de manière itérative, tout en modifiant le nombre de thèmes afin d'observer les différences dans les thèmes extraits. Le défi intrinsèque à cette approche réside dans le choix du nombre optimal de thèmes à extraire à extraire. Ce paramètre doit être déterminé manuellement. Nous avons donc analysé un par un les thèmes automatiquement extraits et jugé de leur cohérence, en retournant et en remettant en contexte les termes extraits à l'intérieur des textes originaux. Nous avons finalement opté pour un total de 35 thèmes, nous permettant ainsi d'obtenir un maximum de thèmes cohérents et un minimum de thèmes peu significatifs. Les thèmes ont été étiquetés manuellement à partir des mots les plus représentatifs de chaque regroupement.
Résultats
Le tableau 1 et la figure 1 présente les résultats générés par l'algorithme de modélisation thématique.
Tope
Mots
% du corpus
vocabulaire 1
œuvres travail exposition vavers artiste maniéré monde œuvre nature sens
18.09%
Vocabulaire 2
artiste projet travad instaileeon résidence création recherche temps espace pratique
10.61%
Vocabulaire 3
voir (os chose sens œuvre dire lorme comment moment semble
9 00%
Vocabulaire 4
artistes exposition art galerie œuvres centre projet pratiques Québec collaboration
5.15%
Vocabulaire 5
artiste gaiere exposition papier salle dessins dessin œuvre termes instalation
4.84%
Vocabulaire 6
espace fceu installation intérieur geler* corps expénence espaces spectateur maison
4.35%
Image
image images regard mouvemenl réalité vue photograph e spectateur pnotographiQu« vison
382%
Scuiptu'e
objets matériaux sculptures objet sculpture éléments installation art termes matière
3.58%
Mise en scène
scène univers artiste culture personnages monde populaire Itcton humour lois
3 29%
Vidéo
vidéo Mm images vidéos cinéma Image bande œuvre installation écran
316%
vie
vie monde nomme animaux humaine humain mort nature amour an mai
3.00%
Photographie
photographie images photographies photographique série photographiques photo exposition photographe portraits
2.94%
Art pubuc
public ville projet espace rue Jeu gens montréal quartier intervention
2.65%
Mémoire
histoire mémoee images archives historee années souvenus documents temps récits
2 62%
Art sonore
sonore sonores musique sons installation écoule audo système ondes haut
2 28%
Identité
culturel
e
identité culture politique pays québec guerre politiques socaété histoire canada
1 88%
Paysage urbain
paysage v*e beux urbain paysages espaces territoire architecture v«es sites
1.86%
Peinture
peinture tableaux tableau peintures couleurs peintre mollis couleur pictural molit
1.7®%
Nature
paysage terre saint nature Québec eau mer nord hiver environnement
1.74%
Corps de la femme
corps femmes peau femme fêmnin chair vêtements travers propre performance
1.48%
Nouvelles
données internet médias technologies numérique technologie science web technologique*
1.45%
technologies
information
Vocabulaire 6
arts art montréal canada travail université présenté travaille toronto festival
1.43%
Temporalité
temps eau corps pian moment silence mouvement action instant vrtesse
1.42%
Marche de rart
art valeur politique critique product on économie marché artistes artistique conceptuel
1.05%
La textuaifte
mots texte livre voix textes langage lecture livres langue écriture
0.98%
Lumière
lumière nuit ciel couleur jour obscurité noire botte blanc bleu
0.93%
Performance
performance performances corps action art actions pubtc vidéo performatif pertormatve
0.92%
Famille
mère père famille tille ans femmes vie entants grand femme
0 80%
Rêve
rêve il rêves jardin béte sommeil mais yves proust mimétisme
0.64%
Jeu
sport jeu tant goutte artaud siècle yxieurs bal Jeux carte
0.54%
Junk topic 1
bol ras texte queer instructions populaire maude Inhospitaééres punk short
0.44%
Films
Mm guerre lllms années lest cinéma parts évènements politiques musée
0.40%
Junktopic2
œuvres créatures œuvre terrartums torét vidéo exposition spectateur ville artiste
0.37%
Voyages
camping tours tour sud visiteurs nord ouest pétrole lisa plaques
0.35%
Junk topic 3
lavreau masques machine expe séripop Christopher tourner ve szabo varady
0.35%
Tableau 1. Résultats de la modélisation thématique.
Figure 1. Résultats structurée de la modélisation thématique.
Une analyse des résultats obtenus met en lumière que la notion de thèmes se manifeste de différentes manière dans notre corpus. Ainsi, certains thèmes sont composés de mots-clés spécialisés et très caractéristiques des textes d'expositions (installation résidence création recherche temps espace, par exemple). Par ailleurs, d'autres regroupements thématiques renvoient sans équivoque à une discipline ou à une technique artistique (vidéo film images vidéos cinéma image bande œuvre). Les résultats du modèle thématique obtenu à partir de notre corpus de textes en art contemporain peuvent être synthétisés de la manière suivante :
1. les mots (les thèmes étiquetés « vocabulaire ») couramment utilisés (comme les verbes voir, faire, sentir) dans les textes d'exposition ou dans le discours artistique
2. les thèmes en art contemporain (révolte, famille, mémoire, rêve)
3. les disciplines ou techniques en art (peinture, sculpture, vidéo, photographie)
4. les thèmes incohérents (« junk topics ») (c'est-à-dire les regroupements sans cohérence apparente).
Distribution des types de topics
Figure 2. Distribution des types de thèmes.
Nous constatons la prépondérance des thèmes traitant du vocabulaire en art contemporain par rapport aux regroupements par sujets ou par technique (figure 2). En effet, la majorité des documents de notre corpus partagent un vocabulaire de base commun, un lexique propre aux textes d'exposition, constituant en quelque sorte le jargon du milieu. En excluant les mots vides, les textes d'exposition semblent donc composés surtout de mots sur le travail général de l'artiste en art (artiste, exposition, travail, projet, création, etc.). Le reste du corpus est consacré aux thématiques et à la technique.
Nous avons cherché à analyser les résultats du modèle thématique en diachronie afin d'observer l'évolution des thèmes dans le temps. À cette fin, nous n'avons conservé que les documents ayant été publié depuis les 16 dernières années, puisque nous ne disposions de très peu de documents dont la publication était antérieure à l'an 2 000. Nous présentons ici que certains thèmes pour lesquels une variation chronologique significative a été notée. Ainsi, les thématiques (figure 3) du “marché de l'art” et la “nature” ont fait l'objet d'un traitement croissant, alors qu'il en va inversement pour les thèmes du “rêve”, de la “famille”, de la “temporalité” et du “corps de la femme”.
Figure 3. Thèmes à variation chronologique significative.
Les discours sur les techniques telles que la sculpture, l'art sonore ou les technologies numériques sont à la hausse depuis 2 000. Nous constatons que le discours sur la peinture est relativement stable, alors que celui sur la photographie et l'art public sont en baisse après avoir connu un intérêt marqué au début du 21e
Conclusion
Dans le cadre de ce projet, nous avons appliqué la modélisation thématique sur un corpus de textes d'ex-
Figure 4. Les techniques à variation chronologique significative.
positions en art contemporain dans les centres d'artistes autogérés du Québec. Les résultats témoignent de l'hétérogénéité des thématiques abordées. Ainsi, certaines thématiques concernent des techniques particulières, alors que d'autres reflètent le vocabulaire spécialisé en art contemporain. Une analyse diachronique des résultats nous a permis de constater l'évolution des thématiques abordées dans les textes produits par les centres d'artistes autogérés du Québec. Cette approche basée sur la notion de “distant reading”, appliqué en histoire de l'art, nous a permis d'observer d'un point de vue macro à la fois les tendances d'un milieu artistique et le vocabulaire communément utilisé dans les textes d'exposition.
2016, à https://www.canopycanopycanopy.com/is sues/16/contents/international_art_english
Bibliography
Bender, K. (2015). Distant Viewing in Art History. A Case
Study of Artistic Productivity. Journal of Digital Art History, (1), 101-109.
Blei, David M. (2012). Probabilist Topic Models. Communications of the ACM, 55(4), 77-84.
Blei, D. M., Ng, A. Y. et Jordan, M. I. (2003). Latent Dirichlet Allocation. Journal of Machine Learning Research, (3),
993-1022.
Blei, D. M. et Lafferty, J. D. Topic Models. In Text mining: classification, clustering, and applications. CRC Press, pp.
71-93.
Graham, S., Milligan, I., & Weingart, S. B. (2016). Exploring big historical data: The historian's macroscope. Imperial College Press.
McCallum, Andrew. (s.d.). MALLET homepage. Machine Learning for Language Toolkit. Repéré 22 avril 2016, à http://mallet.cs.umass.edu/
Réseau art actuel - Répertoire des membres. (s.d.). Réseau Art Actuel. Repéré 20 mai 2016, à http://www.rcaaq.org/html/fr/membres/index.php
Rhody, L. M. (2013). Topic Modeling and Figurative Language. Journal of Digital Humanities. Repéré 21 mai 2016, à http://journalofdigitalhumanities.org/2-
1/topic-modeling-and-figurative-language-by-lisa-m-
rhody/
Triple Canopy - International Art English by Alix Rule &
David Levine. (s.d.). Triple Canopy. Repéré 30 octobre
If this content appears in violation of your intellectual property rights, or you see errors or omissions, please reach out to Scott B. Weingart to discuss removing or amending the materials.
Complete
Hosted at McGill University, Université de Montréal
Montréal, Canada
Aug. 8, 2017 - Aug. 11, 2017
438 works by 962 authors indexed
Conference website: https://dh2017.adho.org/
References: http://web.archive.org/web/20170802132745/https://www.conftool.pro/dh2017/sessions.php
Series: ADHO (12)
Organizers: ADHO