Distant reading Schlaglichter auf die elektronische Literatur Luxemburgs

Luxemburgischer Bestand

Yorick Schmit

Die primäre Aufgabe der Nationalbibliothek ist das Sammeln, Dokumentieren und Archivieren aller auf luxemburgischem Staatsgebiet publizierten Schriften. Hierzu zählen selbstverständlich auch digitale Inhalte, wie etwa das Luxemburger Internet, das per webharvesting durchforstet und archiviert wird. Weniger bekannt ist, dass es in Luxemburg auch einen Markt für E-Books gibt, der sich fast ausschließlich aus literarischen Werken zusammensetzt. So umfasst die noch junge Kollektion elektronischer Literatur in der BnL knapp über hundert Einzelwerke, die in den letzten zehn Jahren erschienen sind: Romane, Kurzgeschichtensammlungen, Gedichtbände, Kinderbücher und Comics.

Im Vergleich zum Papierformat bieten digitale Inhalte nicht nur breiter gefächerte Verkaufs- und Rezeptionsmöglichkeiten, sie erlauben zudem neue Arten der Recherche: die Stichwort- und Datumssuche auf dem eluxemburgensia-Portal der BnL ist nur ein Beispiel. In den digital humanities, wo computergestützte Verarbeitungsmethoden auf geisteswissenschaftliche Forschungsfragen angewendet werden, spricht man in diesem Kontext von distant reading. Das vom Komparatisten Franco Moretti geprägte Schlagwort steht in Opposition zu einem Standardanalyseverfahren der Literaturwissenschaft, dem close reading, also der analytischen Lektüre einiger weniger Werke oder auch nur ausgewählter Textpassagen. Dem Gegenüber setzt man beim distant reading auf das algorithmengestützte Durchkämmen größerer Textkorpora, die z. B. hinsichtlich statistischer Daten zu Stil, Vokabular und Wortfrequenzen untersucht werden. Die so gewonnenen Rohdaten bedürfen zwar der weiteren Interpretation, fußen jedoch auf empirisch nachweisbaren Grundlagen. Moretti plädiert für diesen Paradigmenwechsel, wissend, dass die in den Geisteswissenschaften aufzuarbeitenden Datenmengen traditionelle Recherche- und Rezeptionsmethoden an ihre Grenzen bringen. 

Ein Standardverfahren der digital humanities stellt die sogenannte „Named-Entity-Recognition“ dar, bei der mit großen Datenmengen angelernte Sprachverarbeitungsmodelle automatisiert Eigennamen aus Textkorpora extrahieren, z. B. Personen- und Firmenamen, aber auch geografische Einheiten, wie Länder, Städte, Straßen und Orte. Die so gewonnenen Daten erlauben ungewohnte (Makro-)Perspektiven auf die luxemburgische Literatur, wie am Beispiel von sieben deutschsprachigen E-Books aus der Luxemburgensia-Sammlung aufgezeigt werden soll (vgl. Abb.).

Semantisches Netzwerk der geografischen Referenzen aus sieben deutschsprachigen E-Books aus der Luxemburgensia-Sammlung.

Bereits auf den ersten Blick zeigen sich beträchtliche Unterschiede zwischen den untersuchten Werken: Nora Wageners in Deutschland spielender Gegenwartsroman Menschenliebe und Vogel, schrei enthält nur eine einzige direkte geografische Referenz, indes der historische Roman André Links sowohl nationale als auch internationale Schauplätze in den Fokus rückt. „Luxemburg“ und „Paris“ sind mit jeweils vier Nennungen im Korpus am häufigsten vertreten. Die über den ganzen Globus verteilten Lokalitäten reflektieren die kosmopolitische Weltoffenheit der untersuchten Werke und widersprechen dem Klischee einer auf sich bezogenen Regionalliteratur, das dem luxemburgischen Schrifttum noch immer anhaftet. Bezeichnenderweise hat das Sprachverarbeitungsmodell auch „Sodom und Gomorra“ in Charles Meders Aname als geografische Referenz markiert: eine formal korrekte Kategorisierung, die jedoch die semantische Funktion der Redewendung verkennt. Da neuronale Netzwerke Texte nicht in einem traditionellen Sinn verstehen, sondern nach erlernten, statistisch signifikanten Mustern suchen, stellen Kommunikationsmodi, die über die wörtliche Bedeutung hinausgehen (Metapher, Ironie…), eine methodologische Herausforderung dar. Dies zeigt sich z. B. bei der komputationellen Sentimentanalyse, die die mit einem Text oder einer literarischen Figur konnotierten Emotionen und Stimmungen eruieren soll.

Die spezifischen Stärken und Schwächen der neuronalen Netzwerke beeinflussen unmittelbar Forschungsschwerpunkte und Methoden der komputationellen Literaturwissenschaft, die sich von literaturtheoretischen Abstraktionen entfernt, um die eigentlichen konstitutiven Bausteine der Literatur, Wörter und Sätze, in den Mittelpunkt zu rücken.

Erschienen in Die Warte, 9. Juni 2022, S. 13.

Zum letzten Mal aktualisiert am