Interdisziplinarität modellieren - Über die Modellierung einer Ontologie wissenschaftlicher Prozesse für den Exzellenzcluster Bild Wissen Gestaltung

poster / demo / art installation
Authorship
  1. 1. Christian Stein

    Humboldt-Universität zu Berlin (Humboldt University)

Work text
This plain text was ingested for the purpose of full-text search, not to preserve original formatting or readability. For the most complete copy, refer to the original conference program.

Im November 2012 ist an der Humboldt Universität zu Berlin der Exzellenzcluster Bild Wissen Gestaltung gestartet, der sich selbst als „interdisziplinäres Labor“ bezeichnet. Die Idee hinter diesem Großprojekt ist es, unterschiedlichste wissenschaftliche Disziplinen in ungewöhnlichen und neuen Zusammenstellungen an Fragen unserer Zeit arbeiten zu lassen. Zu einem geisteswissenschaftlichen Schwerpunkt kommen nicht nur Natur- und Technikwissenschaften zusammen, sondern erstmals gleichberechtigt auch Designer und Gestalter. Insgesamt sind über 25 Disziplinen beteiligt. So arbeiten in einzelnen Basisprojekten beispielsweise Architekten, Kunsthistoriker, Germanisten, Informatiker, Chemiker, Kulturwissenschaftler und Interaction Designer zusammen an einer gemeinsamen Fragestellung. Mit zu Hochzeiten über 200 Mitarbeitern ist damit eine Forschungskonfiguration geschaffen, die einzigartig ist und Gelegenheit bietet, das Zusammenarbeiten und die Kommunikationsstrukturen in solchen massiv interdisziplinären Konstellationen zu untersuchen. Darin liegt eines der Hauptinteressen des Clusters: Was ist Interdisziplinarität? Wo funktioniert sie tatsächlich? Und wo nicht? Wann ist sie wirklich hilfreich und zielführend und wann verkommt sie zu einem Schlagwort? Schließlich: Wie kann man das Gelingen der Kommunikation zwischen den Disziplinen sicherstellen bzw. verbessern? Diesen Fragen nähert sich der Cluster mit einer umfangreichen Selbstbeobachtungsstrategie, die in vielen Teilen technisch umgesetzt wird.

Damit steht eine genuin interdisziplinäre Fragestellung im Zentrum dieses Forschungsgroßprojektes und gleichermaßen eine extreme Kommunikationssituation, die sich nur mit digitalen Mitteln adäquat erfassen lässt. Dabei bekommt die Analyse von verwendeter Terminologie und gegenseitigem Verständnis einen wesentlichen Fokus. Selten jedoch konnte sich bisher auf eine spezifische Definition geeinigt werden, die alle Beteiligten vollständig unterstützen. Auch das kann als Terminologiearbeit verstanden werden – allerdings mit einer völlig anderen Zielsetzung als in der klassischen Terminologiearbeit. Dennoch bleibt es das Ziel, auch dieses Arbeiten an Terminologie zu formalisieren, zu ordnen und beschreibbar zu machen.

Die Basisprojekte Virtuelle und reale Architektur des Wissens und Shaping Knowledge setzen sich mit den Möglichkeiten einer solchen Formalisierung auseinander. Als besonders hilfreich haben sich dabei die Erkenntnisse aus dem iglos-Projekt (Akronym für „intelligentes Glossar“) der Technischen Universität Braunschweig erwiesen, mit dem der Exzellenzcluster kooperiert. Das iglos-Team hat jahrelang die Kommunikationsprozesse in interdisziplinären Teams untersucht und darauf basierend ein eigenes Terminologiemanagementsystem entwickelt (www.iglos.de). Dieses setzt auf terminologische Ontologien statt der reinen Sammlung und Listung von Benennungen, Definitionen und ein paar Metadaten. So wird es möglich, die semantischen Zusammenhänge von terminologischen Einträgen als Netzwerk zu modellieren und zu visualisieren, die für ein tatsächliches Begriffsverstehen oft unerlässlich sind. Ein solches semantisches Netz ist auch in der Lage, verschiedene Verständnisräume zu modellieren, die sich nicht ohne weiteres vereinheitlichen lassen.

Für das Erforschen dieser Struktur als Kommunikationssituation wurde daher die Entscheidung getroffen, eine Cluster-Ontologie aufzubauen, die auf die Modellierung einer erweiterten Version der scholarly primitives setzt (Unsworth 2000, Bamboo 2010, Blanke et. al. 2011). Dabei werden Sprachkonstrukte aus bestehenden Ontologien wie beispielsweise Dublin Core, SKOS, FOAF und CIDOC CRM wiederverwendet (Tzompanaki et. al. 2012). Wichtige Überlegung dabei ist, dass sich die Adaption und Verwendungsweise von Terminologie nur dann erfassen lässt, wenn man sich ihre Anwendung durch Personen oder in Quellen und ihre Kookkurrenzen in diesen Umgebungen ansieht. Die Beschreibung von Verständnisräumen erfordert es, die reale Anwendung von Terminologie zu untersuchen und nicht nur die gewollte: Wer verwendet sie? Wer kommuniziert mit wem damit? Welche Quellen verwenden sie? Welche Person rezipiert welche Quellen? Wie sind diese Quellen verbunden? Welche Themen und Communities sind durch welche Terminologie charakterisierbar? Und schließlich: Wer versteht wen unter welchen Umständen überhaupt richtig? Wo kann ein Forscher für ihn interessante Quellen finden? Und mit wem kann er sich über bestimmte Themen unterhalten? Schließlich: Welche basalen Tätigkeiten machen den Alltag eines Forschers aus und welche Konfigurationen davon sind in interdisziplinären Konstellationen überhaupt kommensurabel bzw. kompatibel?

Vier zentrale Topl-Level-Entitäten organisieren gemäß den oben genannten Überlegungen das Schema der Ontologie: Personen, Quellen, Themenund Termini. Unter Personen sind zunächst die konkreten Mitarbeiter des Clusters zu verstehen; hier werden aber auch angegliederte Personen, virtuelle Akteure sowie Personengruppen, Projekte und Teams modelliert. So entsteht zunächst ein Personennetzwerk das Informationen darüber enthält, wer in welchen Organisationseinheiten mit wem steht. Die kontinuierlich durchgeführte Selbstbeobachtung der Clustermitarbeiter erlaubt aber auch eine Modellierung der Kommunikationsverbindungen zwischen den Personen. So kann angegeben werden, wer wie umfangreich mit wem kommuniziert und auf welchem Wege. Diese Informationen werden teils automatisch mit technischen Mitteln und teils durch empirische Beobachtung erfasst.

Aber nicht nur Personen und deren Verbindungen untereinander werden modelliert, sondern auch die Objekte, mit denen sie umgehen. Diese sind in der Ontologie als Quellen gefasst. Quellen können beispielsweise Bücher oder Zeitschriften sein, die Personen lesen. Genauso kann es sich aber auch um produzierte Texte handeln. Neben Texten werden als Quellen auch Zeichnungen, Fotos und Bilder, Modelle und andere Datenformate gefasst. Eine Quelle ist also ein beliebiges, physisches oder digitales Objekt, mit dem interagiert wird. Quellen können auch Beziehungen untereinander aufweisen, beispielsweise im Sinne von Zitation oder Beeinflussung. Auch diese Beziehungen können in der Ontologie detailliert modelliert werden.

Der Sprung auf die inhaltliche Ebene geschieht mithilfe der Themen. Themen fungieren als zusammenfassende Charakterisierung von zusammenhängenden Inhalten. Typische Themen sind beispielsweise Sachgebiete, Domänen, Ausbildungsgänge und ähnliches. Themen können in Baumstrukturen aufgebaut werden, so dass sich allgemeinere und speziellere Themen anlegen und miteinander verbinden lassen. So kann man Themen zur Charakterisierung von Kompetenzen von Personen verwenden. Oder sie werden genutzt, um Quellen zu klassifizieren und so Aussagen über die darin behandelten Inhalte zu treffen. Dabei ist es wahrscheinlich, dass Personen oder Quellen jeweils mehrere Themen zugeordnet bekommen. Die Flexibilität der Ontologie ermöglicht es, verschiedene existierende Klassifizierungssysteme zu integrieren. Hier wird beispielsweise auf das Open Directory zurückgegriffen werden, das eine der umfangreichsten Themenklassifikationen beinhaltet.

Der aus terminologischer Perspektive vielleicht interessanteste Teil der Ontologie ist der des Terminus. Unter Terminus wird im Folgenden „das zusammengehörige Paar aus einem Begriff und seiner Benennung als Elemente einer Terminologie“ verstanden. Da Benennungen sehr häufig in unterschiedlichen Varietäten vorkommen, dort jeweils jedoch mit unterschiedlichen Begriffen verbunden werden, erlaubt die anvisierte Modellierung eine Strukturierung auch dieser Fälle.

Fig. 1:

In der Ontologie des Clusters werden Termini auf unterschiedlichen Ebenen modelliert. Zum einen wird den einzelnen Basisprojekten die Möglichkeit gegeben, terminologische Festlegungen für ihre Bereiche vorzunehmen und sich über die anderer zu informieren. Zum anderen werden in größeren Arbeitsgruppen die oben genannten „großen Begriffe“ diskutiert und theoretisiert werden. Die in diesem Rahmen zu diskutierenden Benennungen beginnen mit dem Namen des Clusters selbst – Bild, Wissen, Gestaltung und Interdisziplinarität. Andere wichtige große Begriffe formieren sich um die Benennungen Struktur, Modell, Architektur, RaumoderCode. Es leuchtet schnell ein, dass diese Bemühungen zwar auch kurze und prägnante Definitionen anstreben, diese aber zwingend umfangreicherer Erläuterungen bedürfen. Darüber hinaus reicht es in diesen Fällen nicht aus, eine einzelne Definition zu finden – vielmehr ist es erforderlich eine ganze Menge dazugehöriger Termini zusammenzubringen, zu strukturieren und zu definieren. Für ein solches Vorgehen sind Ontologien besonders geeignet, da sie die Verbindungen und Zusammenhänge zwischen den Termini modellieren können. Der dritte Anwendungsbereich erstreckt sich auf die Analyse tatsächlicher Terminologieverwendung in den Quellen des Clusters. Ein Großteil der verwendeten Textquellen wird wenn nötig digitalisiert und zentral verwaltet werden. Dazu kommt das Open-Source-System Zoterozum Einsatz, das eine direkte RDF-Schnittstelle besitzt. So kann aus der Ontologie direkt auf die Quellen verlinkt werden. Mit verschiedenen Textminingmethoden werden die Digitalisate dann untersucht. Dazu gehört beispielsweise die Topic Detection, die es ermöglicht, Quellen bestimmten Themen zuzuordnen und den Grad der Relevanz der Quelle für ein Thema zu berechnen. Den Themen in der Ontologie sind dazu Termini zugeordnet, die signifikant für das jeweilige Thema sind. Die Ontologie lernt über die Analysen automatisch neue Termini, die zu einem gegebenen Thema gehören.

Alle diese Entitäten und die Relationen zwischen ihnen werden je nach Bedarf in Unterklassen spezialisiert.

Das Ziel ist es dabei nicht, individuelle und disziplinspezifische Arbeitsweisen über einen Kamm zu scheren – im Gegenteil: Gerade die Heterogenität der Arbeitsweisen besser zu verstehen und mit einer empirischen Datenbasis zu versehen ist nach unserer Überzeugung die Voraussetzung für eine bessere, vielfältigere und innovativere Forschungsarbeit. Wenn sich die Rahmenbedingungen interdisziplinärer Forschung auf Basis der gewonnenen Erkenntnisse auch nur etwas verbessern lassen, ist bereits viel gewonnen – denn interdisziplinäre Strukturen werden immer häufiger und nichts verschwendet so viele Ressourcen wie ungünstige Bedingungen und falsche Annahmen.

Am 1. Juni fand die offizielle Eröffnung des Exzellenzclusters Bild Wissen Gestaltung statt. Hunderte Besucher haben die Projekte begutachtet, sich informiert und angeregt diskutiert. Nun heißt es für unser Team, unsere Pläne umzusetzen. Was daraus wird und wie sich unsere Arbeit entwickelt kann man mit kontinuierlichen Updates auf der Webseite des Clusters verfolgen unter www.interdisciplinary-laboratory.hu-berlin.de.

References
Bamboo (2010): Project Bamboo Scholarly Practice Report.

wikihub.berkeley.edu/download/attachments/68619618/bamboo_scholarly_practice_report.pdf?version=2&modificationDate=1292887646732

Blanke, T., & Hedges, M. (2011). Scholarly primitives: Building institutional infrastructure for humanities e-Science. Future Generation Computer Systems.

doi:10.1016/j.future.2011.06.006

Tzompanaki, K., & Doerr, M. (2012). Fundamental Categories and Relationships for intuitive querying CIDOC CRM based repositories.139.91.151.170/tech-reports/2012/2012.TR429_Intuitive_querying_CIDOC-CRM.pdf

Unsworth, J. (2000). Scholarly Primitives: what methods do humanities researchers have in common, and how might our tools reflect this? Symposium on Humanities Computing formal methods experimental practice. www3.isrl.illinois.edu/~unsworth/Kings.5-00/primitives.html

If this content appears in violation of your intellectual property rights, or you see errors or omissions, please reach out to Scott B. Weingart to discuss removing or amending the materials.

Conference Info

Complete

ADHO - 2014
"Digital Cultural Empowerment"

Hosted at École Polytechnique Fédérale de Lausanne (EPFL), Université de Lausanne

Lausanne, Switzerland

July 7, 2014 - July 12, 2014

377 works by 898 authors indexed

XML available from https://github.com/elliewix/DHAnalysis (needs to replace plaintext)

Conference website: https://web.archive.org/web/20161227182033/https://dh2014.org/program/

Attendance: 750 delegates according to Nyhan 2016

Series: ADHO (9)

Organizers: ADHO