neonion - Kollaboratives Annotieren zur Erschließung von textuellen Quellen

poster / demo / art installation
Authorship
  1. 1. Claudia Müller-Birn

    Freie Universität Berlin (FU Berlin)

  2. 2. Andre Breitenfeld

    Freie Universität Berlin (FU Berlin)

Work text
This plain text was ingested for the purpose of full-text search, not to preserve original formatting or readability. For the most complete copy, refer to the original conference program.


Im Rahmen einer Posterpräsentation stellen wir die kollaborative Annotationssoftware
neonion vor, dessen Entwicklung inspiriert wurde von der Vision des Memex. Vannevar
Bush führt in seinem Artikel dazu aus, dass “[a] record if it is to be useful to
science, must be continuously extended, it must be stored, and above all it must be
consulted.” (Bush 1945: 37). Ein solcher “record” kann beispielsweise ein
historisches Dokument sein. Am Anfang des Forschungsprozesses, ist noch wenig
darüber bekannt, aber das Wissen um dieses Dokument wächst kontinuierlich durch die
Forschungsarbeit der Wissenschaftler_innen. Mit Hilfe von neonion sollen Forschende Dokumente gemeinschaftlich mit Hilfe von
Annotationen erschließen können (Müller-Birn et al. 2015). Die Software wird mit dem
Ziel entwickelt, als Forschungsumgebung zu fungieren, um kollaborative
Wissensgenierung im Rahmen von Annotationsprozessen in der Forschungsarbeit zu
analysieren.
Die grundsätzlichen funktionalen Anforderungen an die Software neonion wurde
basierend auf den Erkenntnissen einer Interviewstudie durchgeführt. Ingesamt wurden
sechs Interviews durchgeführt. Diese Interviews waren semi-strukturiert und wurden
am Arbeitsplatz durchgeführt, um auch Informationen über das Arbeitsumfeld zu
erlangen und einen direkten Einblick in die genutzten Softwarewerkzeuge und Abläufe
zu erhalten. Die Interviews dauerten eine bis anderhalb Stunden und wurden
anschließend transkribiert. Alle Teilnehmer_innen waren Mitglieder der gleichen
Forschungsreinrichtung (für weitere Informationen s. Müller-Birn et al. 2015). Das
Ziel dieser Studie war es, den Kontext der Forschungsarbeit in den
Geisteswissenschaften besser zu verstehen. Solche Interviews sind zentral bei der
nutzerzentrierten Softwareentwicklung, einem Ansatz, der bei uns konsequent verfolgt
wird. Die Ergebnisse der Interviews wurden nach vier Gesichtspunkten ausgewertet:
Form, Funktion, Wert und Status (in Anlehnung an Marshall 1998). Wir nutzen diese
Ergebnisse im Folgenden, um die grundsätzlichen Funktionen von neonion vorzustellen.
Der Bereich Form setzt sich mit der Struktur von Annotationen auseinander. Die Mehrzahl der Befragten gab an, vor allem basierend auf Textdokumenten zu forschen. Daher wurde entschieden, neonion zunächst für Textdokumente zu verwenden. Die Softwarearchitektur wurde mit Webframeworks umgesetzt. Hierzu findet Django im Bereich des Back-Ends und vorrangig Bootstrap und AngularJS im Front-End Anwendung. Die erzeugten Annotationen werden zur dauerhaften Aufbewahrung zum einen in den AnnotationStore, der auf Grundlage von ElasticSearch arbeitet, gespeichert, zum andern in den Sesame Triple Store eingespeist.

Abb. 1: Auswahl des
Annotationsmodus im Annotator

Im Bereich Funktion wurde der Frage der Verwendung nachgegangen. So wurde
ersichtlich, dass unterschiedliche Annotationsmodi (s. Abbildung 1) notwendig sind.
In neonion werden daher drei Arten der Annotation unterschieden: die Markierung für
Zitate, der Kommentar für Paraphrase und semantische Tags für das semantischen
Erschließen von Dokumenten (z. B. basierend auf einer zugrundeliegenden Ontologie).
Auch wenn diese drei Arten von Annotationen aus den Interviews entstanden sind,
können diese Annotationsmodi je nach Anwendungszweck sehr variabel eingesetzt
werden. Ein Einsatz von neonion im Bereich der Linguistik wäre beispielsweise
möglich, aber ein praktischer Anwendungsfall fehlt bisher.
Zur Implementierung der Annotationskomponente kommt die quelloffene JavaScript Bibliothek Annotator.js zum Einsatz. Die Bibliothek der OKFN wurde zusätzlich durch eigene Plug-Ins, insbesondere zur Realisierung einer semantischen Annotation, erweitert.

Abb. 2: Annotationsübersicht
gefiltert nach semantischen Tags

Der längerfristige Wert der Annotation wurde im dritten Bereich untersucht. Hier
wurde von allen Interviewteilnehmer_innen angegeben, dass eine Weiterverwendung der
Annotationen in anderen Kontexten nicht möglich ist, da die verwendete Software den
Export der Annotationen verhinderte. Diese Mangel sollte in neonion behoben werden.
Alle Annotation werden einerseits innerhalb eines standardisierten Datenmodells –
dem Open Annotation Data Models (OADM) - gespeichert und anderseits haben Nutzende
die Möglichkeit, alle ihre Annotationen nach unterschiedlichen Gesichtspunkten zu
filtern und in ein Textdokument zur Weiterverarbeitung, z. B. in ein
Textverarbeitungsprogramm zu exportieren (s. Abbildung 2). Mit Hinblick auf die
Kollaboration besteht die Möglichkeit Annotationen innerhalb von Gruppen mit anderen
Nutzer_innen zu teilen bzw. gemeinschaftlich Dokumente zu annotieren. Ebenfalls
können die verwendeten strukturierten Vokabulare gemeinschaftlich erstellt werden.
Es ist geplant, hier entsprechend benötigte Diskussionsfunktionen einzubauen.
Darüber hinaus wurde das bestehende Open Annotation-Datenmodell um die Möglichkeit erweitert, semantische Tags über eine typisierte Verbindung in Relationen zueinander zu setzen. Die semantischen Tags stellen in diesem Zusammenhang Instanzen von vordefinierten Konzepten mit eigener URI (Unified Resource Identifier) dar und ermöglichen durch die Beziehung der Instanzen zueinander eine mehrstufige Analyse von Annotationen.

Abb. 3: Defintion eines
Begriffsystems als Concept Sets

Im vierten Bereich wurde der Frage nachgegangen, wie Annotationen inhaltlich geteilt
werden. Unsere Interviewpartner führten aus, dass vor allem im Bereich der
strukturierten Annotationen (semantische Tags basieren auf einem vordefinierten
Begriffssystem) es sehr umständlich und zeitaufwändig ist, ein gemeinschaftliches
Begriffssystem zu erstellen. In neonion können solche Begriffssysteme, die zu einer
Ontologie weiterentwickelt werden können, einfach als sogenannte Concept Sets (s.
Abbildung 3) hinterlegt werden. Diese Concept Sets können dann auch wieder anderen
Personen in neuen Forschungskontexten zur Verfügung gestellt werden. Aus technischer
Sicht bietet das Backend von neonion verschiedene Dienste an, um Annotationen und
Concept Sets mit unterschiedlichen Systemen über eine spezifizierte REST API oder
SPARQL Endpoint auszutauschen.

Bibliographie

Bush, Vannevar (1945). „The atlantic monthly”. in: As we may think 176, 1: 101-108.

Marshall, Catherine C. (1998) „Toward an ecology of
hypertext annotation", in: Proceedings of the ninth ACM
conference on Hypertext and hypermedia: links, objects, time and
space —structure in hypermedia systems 40-49.

Müller-Birn, Claudia / Klüwer, Tina / Breitenfeld, Andre /
Schlegel, Alexa / Benedix, Lukas (2015) „neonion: Combining Human
and Machine Intelligence“, in: Proceedings of the 18th ACM
Conference Companion on Computer Supported Cooperative Work & Social
Computing 223-226.

If this content appears in violation of your intellectual property rights, or you see errors or omissions, please reach out to Scott B. Weingart to discuss removing or amending the materials.

Conference Info

In review

DHd - 2016
"Modellierung - Vernetzung – Visualisierung: Die Digital Humanities als fächerübergreifendes Forschungsparadigma"

Hosted at Universität Leipzig (Leipzig University)

Leipzig, Germany

March 7, 2016 - March 11, 2016

160 works by 433 authors indexed

Conference website: http://dhd2016.de/

Contributors: Patrick Helling, Harald Lordick, R. Borges, & Scott Weingart.

Series: DHd (3)

Organizers: DHd