Wie dokumentiert man eine Pandemie? Digitale Pflichtabgabe und Langzeitarchivierung in der Nationalbibliothek - am Beispiel der Covid-19 -Sammlung

Luxemburgischer Bestand

Yorick Schmit, Roxana Maurer

The duty to document does not cease in a crisis, it becomes more essential – so der ICA (International Council on Archives) in einem Aufruf an die Weltöffentlichkeit am Anfang der Corona-Pandemie. Während das öffentliche Leben zum Stillstand kam und die fieberhafte Suche nach einem Impfstoff begann, standen Archivare, Bibliothekare und Informatiker einer gänzlich anderen Herausforderung gegenüber: Wie archiviert und dokumentiert man eine der ersten globalen Krisen, die in einer digitalisierten Gesellschaft stattfindet? Nie zuvor wurden so schnell so große Datenvolumina generiert. Nie zuvor war es so einfach, über Ländergrenzen hinaus zu kommunizieren und Wissen zu teilen. Doch digitale Daten jedweder Art, seien es Kommentare in den sozialen Medien, Forschungsberichte oder Infektionsstatistiken, sind von Natur aus ephemer und kurzlebig – was sowohl auf den gesellschaftlichen Kommunikationsrahmen, in dem sie entstehen, als auch auf technische Charakteristika des Mediums zurückzuführen ist.

Um gleich zu Beginn der Pandemie die größtmögliche Masse an Daten zu sichern, musste zeitnah reagiert werden. Im April 2020 startete die Nationalbibliothek deshalb eine Kommunikationskampagne, die vor allem staatliche und kommunale Akteure tangierte. Im Rahmen der Pflichtabgabe („dépôt légal“) wurden sie aufgerufen, jedwede publizierte Schrift zur Pandemie (sei es digital oder auf Papier) einzusenden, insbesondere jene Dokumente, die bei der Pflichtabgabe traditionell vernachlässigt werden, jedoch aus historischer Perspektive durchaus relevant sind, z. B. Broschüren, Flyer, Informationsblätter, Poster, Sticker etc... Parallel dazu wurde im Luxemburger Webarchiv eine Corona-Kollektion angelegt. Über 800 Webseiten mit Bezug zur Coronakrise werden seit März 2020 von automatisierten Suchprogrammen, sogenannten web crawlern, durchkämmt und gesammelt.

Indes Papierdokumente in lichtgeschützten Archivräumen und spezifischem Raumklima aufbewahrt werden müssen, gestaltet sich die Archivierung digitaler Daten um einiges komplexer und vielschichtiger. Leitend für die Nationalbibliothek ist dabei die Frage: Welche Maßnahmen müssen getroffen werden, um den langfristigen Zugang zu digitalen Daten zu garantieren? Aufgrund der ephemeren Natur digitaler Inhalte werden in einem ersten Schritt mehrere Kopien der Daten angefertigt, die an verschiedenen geografischen Standorten aufbewahrt und durch unterschiedliche Speicherverfahren abgesichert werden. Um die Notwendigkeit einer solch aufwändigen Prozedur zu illustrieren, reicht ein Blick nach Armenien: Am Anfang des pandemiebedingten Lockdowns kam es durch überlastete Server zu einem Brand in der armenischen Nationalbibliothek. Fast ein ganzes Jahrzehnt an digitalisiertem Material schien verloren –  bis durch Zufall zusätzliche, an anderer Stelle gespeicherte Sicherungskopien gefunden wurden. Dank ihnen gelang es, das digitale Archiv zu retten und den Zugang für die Benutzer wiederherzustellen.

Im Gegensatz zu Papierdokumenten können digitale Dokumente nicht direkt, sondern nur mit Hilfe von spezifischen Computerprogrammen eingesehen werden. Um eine langfristige Lesbarkeit der Daten zu garantieren, müssen die Dateien deshalb regelmäßig kontrolliert werden, um Dateischäden oder -verluste zu erkennen und zu beheben. Auch der technologische Fortschritt stellt eine Herausforderung dar: Die in Computern verwendete Software und die damit verbundenen Dateiformate sind einem steten Wandel unterworfen. Hier muss sichergestellt werden, dass die Dateiformate lesbar bleiben und die hierfür notwendige Software zur Verfügung steht.

Die Corona-Krise hat den gesellschaftlichen Digitalisierungsprozess exponentiell beschleunigt. Sowohl private als auch staatliche und kommunale Akteure griffen in der Pandemie verstärkt auf digitale Kommunikations- und Publikationsmethoden zurück, ein Trend, der sich auch in Zukunft fortsetzen wird. Diese stetig wachsende Datenmenge stellt die Nationalbibliothek vor größere Herausforderungen:  Daten müssen nämlich nicht nur gesammelt, sondern auch zugänglich und durchsuchbar gemacht werden. Ein wichtiger Schritt in diesem Prozess stellt die sogenannte Metadatenanreicherung dar: Hierbei werden Informationen über Herkunft, Autoren, Erstellungszeitraum, aber auch über technische Charakteristika der archivierten Dateien gesammelt und gespeichert. Erst durch diese Prozedur werden Rechercheoptionen, wie man sie auf a-z.lu oder eluxemburgensia.lu findet, technisch möglich.

Besondere Beachtung im Langzeitarchivierungsprozess verdienen auch die Zugangslinks zu den digitalen Dokumenten. Ein Internet-Link hat eine durchschnittliche Lebensdauer von nur 44 Tagen. Danach existiert die Webseite wahrscheinlich nicht mehr, oder wurde auf dem Server verschoben oder umbenannt. Um diesem Trend entgegenzuwirken und sicherzustellen, dass die Benutzer auch in Jahrzehnten noch dieselben URLs für die Objekte des digitalen Archivs verwenden können – obwohl die benutzten Plattformen und Formate in der Zwischenzeit mehrfach gewechselt haben – wird an jedes archivierte Objekt ein individueller Code vergeben. Man spricht hier von einem sogenannten ARK (Archival Ressource Key), der ein Objekt permanent identifizier- und auffindbar macht.

Bereits jetzt wird der Großteil des kollektiven Wissens der Menschheit in digitaler Form veröffentlicht und verbreitet. Die oben beschriebenen Sammel- und Archivierungsverfahren sollen dazu beitragen, das digitale Gedächtnis Luxemburgs auch für zukünftige Generationen zu erhalten.

Erschienen in Die Warte, 29. September 2022, S. 10.

Zum letzten Mal aktualisiert am