Biographik in den Digital Humanities – Kritische Bestandsaufnahme und quantitative Analysemöglichkeiten am Beispiel des Österreichischen Biographischen Lexikons 1815–1950

poster / demo / art installation
Authorship
  1. 1. Matthias Schlögl

    OEAW Österreichische Akademie der Wissenschaften / Austrian Academy of Sciences

  2. 2. Ágoston Bernád

    OEAW Österreichische Akademie der Wissenschaften / Austrian Academy of Sciences

  3. 3. Maximilian Kaiser

    OEAW Österreichische Akademie der Wissenschaften / Austrian Academy of Sciences

  4. 4. Katalin Lejtovicz

    OEAW Österreichische Akademie der Wissenschaften / Austrian Academy of Sciences

  5. 5. Peter Rumpolt

    OEAW Österreichische Akademie der Wissenschaften / Austrian Academy of Sciences

Work text
This plain text was ingested for the purpose of full-text search, not to preserve original formatting or readability. For the most complete copy, refer to the original conference program.


Quantitative Auswertungen gewinnen zunehmend auch in den Geisteswissenschaften an Bedeutung (z. B. Harber 2011). Nicht selten wird mittlerweile auch der Begriff „Big Data“ in Zusammenhang mit den Humanities ganz allgemein verwendet (z. B. gral 2016).  Für solche Analysen wird des Öfteren auf einheitliche Korpora zurückgegriffen (z. B. Wikipedia: Russo et al. 2015), die nicht nur einen standardisierten Zugriff auf tausende Datensätze, sondern auch homogene Metadaten und harmonisierte Vokabulare bieten. Während diese Korpora formal geradezu prädestiniert für Analysen mit den neuen digitalen Tools scheinen, sind die grundlegenden Daten durch die Entstehungsgeschichte der Datensammlungen nicht selten unausgewogen und können mitunter zu falschen Ergebnissen führen. Insbesondere trifft dies auf über einen längeren Zeitraum entstandene Nationalbiographien zu. Trotz dieses offensichtlichen Dilemmas fokussieren Studien meist auf die Zuverlässigkeit der digitalen Tools selbst und weniger auf die Verlässlichkeit der Quellen (z. B. Reinert et al. 2015; Stotz et al. 2015).

Die Posterpräsentation bietet eine exemplarische Korpusanalyse der digitalen Fassung des 1946 gegründeten und seit 1954 (seit 2009 auch online) erscheinenden
Österreichische Biographische Lexikon 1815–1950.
Dieses enthält in 14 Bänden (68 Lieferungen) über 18.000 Biographien. Es wird dadurch die oftmals vernachlässigte Unausgewogenheit einer auf den ersten Blick einheitlich wirkenden Quelle diskutiert.

Analyse der vorläufigen Ergebnisse

1. Informationsdichte

Anders als ursprünglich angenommen, bleibt die Informationsdichte (Named Entities pro tokens) mit steigender Länge der Biographietexte etwa gleich hoch. Biographien werden inhaltlich bereits ab Anfang der 1960er-Jahre umfangreicher. Ab den 1980er-Jahren zeigt die Kurve eine sehr deutliche Steigerung (Abb. 1.).

Abbildung 1: Durchschnitt Tokens und Named Entities nach Lieferung

Diese Entwicklung lässt sich anhand der Werkgenese bzw. der Geschichte des Lexikons erklären. Nach den ursprünglichen Plänen sollte das ÖBL drei bis vier Bände an Kurzbiographien umfassen. Die ab 1946 verfassten Biographien der ersten fünf Lieferungen – gesammelt im ersten Band, 1957 erschienen – sind allesamt nach diesem Konzept entstanden. Aus methodischen Gründen wurde der Ursprungsplan jedoch bereits in den 1950er-Jahren als unbrauchbar verworfen. Die Österreichische Akademie der Wissenschaften entschied sich für die Gestaltung eines umfangreichen Nachschlagewerkes (Reitterer 1998) wodurch die durchschnittliche Länge der Biographien deutlich anstieg.

2. Die geographische Verteilung der Geburtsorte der biographierten Personen
Die geographische Verteilung der Biographierten nach Geburtsorten ist nicht ausgewogen. Verglichen wurden die erste Lieferung des ÖBL (1954) mit den Lieferungen 62-66 (2010–2015); beide Stichproben enthalten etwa gleich viele Biographien (Abb. 2. und 3.).

Abbildung 2: Verteilung der Geburtsorte in der 1. Lieferung des ÖBL (1954)

Abbildung 3: Verteilung der Geburtsorte in den Lieferungen 62–66 des ÖBL (2010–2015)

Die Kronländer der westlichen Reichshälfte der Monarchie (u. a. die Nachfolgestaaten Österreich und Tschechien) sind in der ersten Lieferung gegenüber der östlichen Reichshälfte (auf den Abbildungen die Nachfolgestaaten Ungarn, Slowakei, Rumänien [Siebenbürgen], Kroatien) deutlich bevorzugt. Die Verteilung der Geburtsorte in den Lieferungen 62–66 zeigt hingegen ein wesentlich ausgeglicheneres Bild. Die Diskrepanz resultiert aus den ursprünglichen Aufnahmekriterien des ÖBL, die zeitlich und räumlich, einerseits nach kulturhistorischen Gesichtspunkten, andererseits jedoch staatsrechtlich definiert wurden (Obermayer-Marnach 1957). Bei der Aufnahme von Personen fokussierte man zwar auf den gesamten Raum des ehemaligen Habsburgerreiches, allerdings mit der Einschränkung, dass nach dem Ausgleich (1867) auf dem Gebiet der Länder der Ungarischen Krone geborene Personen – von wenigen Ausnahmen abgesehen – nicht in das Lexikon aufgenommen wurden.

3. Anteil weiblicher Persönlichkeiten im ÖBL
Der Anteil weiblicher Biographierter hat sich über die mehr als siebzig Jahre lange Geschichte des Lexikons kaum verändert (Abb. 4.).

Abbildung 4: Männliche und weibliche Personen im ÖBL nach Lieferung

Unsere ursprüngliche Annahme, die ab den 1970er- und 1980er-Jahre sich entfaltende Frauen- und Geschlechtergeschichte hätte in diesem Zusammenhang eine positive Auswirkung auf die Anzahl der in das Lexikon aufgenommenen Frauen gehabt, konnte nicht bestätigt werden. Der geringe Anstieg ab der 50. Lieferung lässt sich auf den relativ hohen Frauenanteil in der Hauptberufsgruppe “Musik und darstellende Kunst” zurückführen (Abb. 5.).

Abbildung 5: Verteilung weiblicher Personen im ÖBL nach Hauptberufsgruppen und Lieferung

Der relativ geringe Anteil an Frauen lässt sich durch den Berichtszeitrahmen des ÖBL, allen voran jedoch durch den Schwerpunkt 19. Jahrhundert erklären. Als Beispiel sei hier lediglich darauf verwiesen, dass in der Monarchie Frauen die Möglichkeit des Studiums großteils verwehrt blieb (Heindl, Tichy 1993). Anteilsmäßig findet man die meisten Frauen in der Berufsgruppe „Diverse“, in der u. a. die Mitglieder des Kaiserhauses erfasst werden (Abb. 6.).

Abbildung 6: Anteil der Frauen in den einzelnen Hauptberufsgruppen des ÖBL

Conclusio

Die vorliegende erste Analyse zeigt exemplarisch die erheblichen Variationen innerhalb der Biographien des ÖBL (Informationsdichte, Herkunftsländer, Geschlecht). Nationalbiographien wie das ÖBL können zu einer wertvollen Ressource für die quantitativen Geschichtswissenschaften - Stichwort “BigData” - werden, wenn die Herausforderungen ihrer heterogenen Zusammensetzung gelöst werden.

Bibliographie

Österreichisches Biographisches Lexikon 1815–1950. Wien: Böhlau Verlag, Verlag der Österreichischen Akademie der Wissenschaften, 1954ff.; Online-Ausgabe:

www.biographien.ac.at
, Zugriff: 14.12.2017.

Haber, P. (2011): „Neue – digitale – Wege für die Geschichtswissenschaft?: Die Rückkehr der Zahlen und Daten“. In:
Neue Zürcher Zeitung, 2.1.2011.

gral (2016): „Big Data in den Geschichtswissenschaften“. In:
Die Presse, 4.4.2016.

Russo, I.; Caselli, T.; Monachini, M. (2015): „Extracting and Visualising Biographical Events
from Wikipedia“. In: S. ter Braake et al. (eds.),
BD2015. Biographical Data in a Digital World 2015. Proceedings of the 1st Conference on Biographical Data in a Digital World, Amsterdam, 111–115.

Reinert, M.; Schrott, M.; Ebneth, B. et al. (2015): „From Biographies to Data Curation – The Making of www.deutsche-biographie.de“. In: S. ter Braake et al. (eds.),
BD2015, 13–19.

Stotz, S.; Stuß, V.; Reinert M.; Schrott M. (2015): „Interpersonal Relations in Biographical Dictionaries. A Case Study“. In: Serge ter Braake et al. (eds.),
BD2015, 74–80.

Gruber, Ch.; Feigl, R. (2009): „Von der Karteikarte zum biografischen Informationsmanagementsystem: Neue Wege am Institut Österreichisches Biographisches Lexikon und biographische Dokumentation“. In: M. Schattkowsky, F. Metasch (eds.),
Biografische Lexika im Internet: Internationale Tagung der „Sächsischen Biografie“ in Dresden (30. und 31. Mai 2008)
, Bausteine aus dem Institut für Sächsische Geschichte und Volkskunde 14, Dresden, 55–75.

Reitterer, H. (1998): „Österreichisches Biographisches Lexikon und biographische Dokumentation“. In: Csendes P., Lebensaft E. (eds.),
Traditionelle und zukunftsorientierte Ansätze biographischer Forschung und Lexikographie
, ÖBL – Schriftenreihe 4, Wien, 42–46.

Obermayer-Marnach E. (1957): „Einleitung“. In:
Österreichisches Biographisches Lexikon 1815–1950, Bd. 1, X–XV.

Latzke W. (1960): „Österreichisches Biographisches Lexikon 1815–1950, Bd. 1. und 2.“. In:
Archivalische Zeitschrift
56, 1960, 143–145.

Heindl, W.; Tichy, M, eds. (1993): „
»Durch Erkenntnis zu Freiheit und Glück …«. Frauen an der Universität Wien (ab 1897)
, Schriftenreihe des Universitätsarchivs, Universität Wien 5, Wien.

If this content appears in violation of your intellectual property rights, or you see errors or omissions, please reach out to Scott B. Weingart to discuss removing or amending the materials.

Conference Info

In review

DHd - 2018
"Kritik der digitalen vernunft"

Cologne, Germany

Feb. 26, 2018 - March 2, 2018

160 works by 418 authors indexed

Conference website: https://dhd2018.uni-koeln.de/

Contributors: Patrick Helling, Harald Lordick, R. Borges, & Scott Weingart.

Series: DHd (5)

Organizers: DHd