Persistent Identifier

Persistent Identifier

Der technologische Wandel, Hard- und Softwarefehler oder Datenverstümmelung sowie kurzlebige und leicht veränderbare Weblinks erschweren die langfristige Sicherung digitaler Inhalte. Um den letztgenannten Aspekt anzugehen, hat die Nationalbibliothek ein auf dem Archival-Resource-Keys-Format (ARK) basierendes Persistent-Identifier-System eingeführt, durch das sichergestellt wird, dass Links zu Luxemburgs digitalen Ressourcen dauerhaft zugänglich bleiben. Jede Einrichtung in Luxemburg, die digitale Sammlungen verwaltet, kann von diesem Dienst profitieren.

Wichtigste Vorteile

Das ARK-Format beruht auf folgenden Grundprinzipien:

Breiter Anwendungsbereich

ARKs können jedem digitalen, materiellen oder abstrakten Objekt zugeordnet werden: digitalisierten oder digital entstandenen Dokumenten und Objekten, (wissenschaftlichen) Publikationen und Datensätzen, genealogischen Darstellungen, Museumsexemplaren, Lern- und Lehrmaterialien, Autoren, Wissenschaftlern usw. Seit 2001 haben sich weltweit mehr als 1.000 Einrichtungen im Hinblick auf die Zuordnung von ARKs engagiert, darunter National- und Universitätsbibliotheken und -archive, Kunstmuseen, naturhistorische Museen, Verlage, Datenzentren, staatliche Einrichtungen, Händler und Forschungslabore.

Beständigkeit

ARKs stellen einen permanenten Zugang zu digitalen Informationen sicher und gewährleisten damit Beständigkeit trotz technologischer Veränderungen (wie z.B. Veränderungen bei Zugriff-URLs aufgrund von Systemupgrades oder Formatmigrationen) oder organisationsbezogener Veränderungen (wie z.B. Namenswechsel von Einrichtungen). Sie führen zu einer besseren Zitierfähigkeit bei Links und ermöglichen es dem Nutzer, konkrete digitale Ressourcen einfacher über Hyperlinks zu referenzieren und zu identifizieren. Dies erleichtert das Zitieren von Ressourcen in sehr unterschiedlichen Kontexten, wie Publikationen, wissenschaftlichen Artikeln, Webseiten oder Bookmarks und sorgt für die Beständigkeit und dauerhafte Funktionalität von Hyperlinks.

Keine Neuzuordnung

Ist ein ARK-Identifier erst einmal einem Objekt zugeordnet und mit diesem verbunden, bleibt er auf unbestimmte Zeit einmalig. Sogar im Falle der Entfernung einer Ressource ist es wichtig, dass ein veröffentlichter ARK weiter besteht und den Nutzer entweder zu den Metadaten der Ressource oder zu einer Erklärung für die Unzugänglichkeit des Objektes führt. Darüber hinaus kann dem Nutzer der Zugang zu einer Ersatzressource bereitgestellt werden.

Opazität

Die in Persistent Identifier verwendeten Zeichenfolgen sind im Allgemeinen „opak“ (d.h. sie haben keine Bedeutung) und enthalten absichtlich wenig Hinweise auf dasjenige, dem sie zugeordnet sind. Opake Identifier bleiben im Laufe der Zeit unverändert und gewährleisten einen konstanten Zugang zu digitalen Ressourcen, selbst wenn deren Standort oder Metadaten sich ändern. Dadurch, dass keine Informationen über die zugrunde liegende Ressource geliefert werden, können zudem der Schutz der Privatsphäre und die Sicherheit verbessert werden.

Metadaten

Metadaten („Daten über Daten“, d.h. Informationen über eine Ressource) führen zu einer wesentlichen Erleichterung des Verständnisses von und der Arbeit mit opaken Identifier, die keinerlei Hinweise darauf enthalten, was durch sie identifiziert wird. Ohne Metadaten müsste man, um zu wissen, auf welches Objekt ein ARK verweist, unmittelbar auf das Objekt zugreifen. Unabhängig davon, ob ein ARK zu einer Webseite oder einer Datei führt, liefern die Metadaten äußerst wichtige Informationen über das Objekt, wie z.B. dessen Erstellungsdatum oder Herkunft oder Informationen über die Verfügbarkeit neuerer Versionen. Um auf Metadaten einer Ressource zuzugreifen, kann man bei einem ARK einfach „?info“ hinzufügen (Beispiel: https://persist.lu/ark:70795/tm9z0j?info). Auch wenn die Erstellung von Metadaten nicht unbedingt erforderlich ist, wird sie doch nachdrücklich empfohlen, um die Verwendung und Verwaltung von ARKs zu erleichtern.

Im Falle des Persistent-Identifier-Dienstes der BnL enthalten die Metadaten Einzelheiten zu der Einrichtung, die den ARK erstellt hat, die aktuelle Zugriff-URL der Ressource und den Zeitpunkt der Erstellung und letzten Aktualisierung des ARK. Um das Verständnis zu erleichtern, sind diese Metadaten als Antwort auf die Fragen „Wer?“, „Was?“ und „Wann?“ strukturiert.

Die „Policy / Persistence Statement“ („Politik / Persistence-Erklärung“) vermittelt einen Überblick über das Engagement der Einrichtung im Hinblick darauf, wie die Ressource verbreitet werden wird, ob sich der Inhalt im Laufe der Zeit ändern wird oder wie lange sie verfügbar sein wird.

Wie funktionieren Persistent Identifier?

Ein ARK besteht aus drei wesentlichen Teilen: dem Resolver, dem Unique Core Identifier (auch als Base Object Name bezeichnet) und einem optionalen Suffix.

Resolver

Ein Persistent Identifier bleibt selbst dann funktionsfähig, wenn die Website der verbundenen Ressource wechselt. Dies wird durch einen Resolver ermöglicht, der als spezialisierte Website dient, welche die Identifier auf die passendste aktuelle Adresse umleitet. Die persist.lu-Website dient als Resolver für ARKs, die Einrichtungen in Luxemburg zugeteilt wurden. Um eine wirksame Umleitung zu gewährleisten, müssen die Institutionen, die zur Zuordnung von ARKs berechtigt sind, dafür sorgen, dass ihre URLs stets aktualisiert sind, und dem Resolver sämtliche Veränderungen melden.

Ein Resolver verbindet ein Protokoll (z.B. „https“ oder „http“) mit einem als Name Mapping Authority bezeichneten Hostname, da es sich um einen Dienst handelt, der einen Namen als Input annimmt und zu Dingen wie dem Objektinhalt, den Objektmetadaten oder den Object Policies zurückleitet (dahin „mapt“). Obwohl Multiple Hosting Arrangements möglich sind, sind nur einige URLs dazu bestimmt, langfristig unverändert zu bleiben. So führt z.B. sowohl https://persist.lu/ark:70795/tm9z0j als auch https://viewer.eluxemburgensia.lu/ark:70795/tm9z0j zu derselben Ressource (zur Ausgabe der Wochenzeitung d’Lëtzebuerger Land vom 3. Mai 2002), doch nur bei der persist.lu-URL ist gewährleistet, dass sie auch in den kommenden Jahrzehnten noch in der gleichen Weise funktionsfähig sein wird.

Core Identifier

Der Base Object Name bzw. Core Identifier besteht aus drei Teilen: dem „ark:“-Label, der Name Assigning Authority Number (NAAN) und dem dem Objekt zugeordneten Namen. Bei der NAAN handelt es sich um eine Nummer oder Zeichenfolge zur Identifizierung einer Einrichtung, welche Identifier erstellt oder zuteilt. Im obigen Beispiel ist „70795“ die der Nationalbibliothek zugeteilte NAAN, während „tm9z0j„ der Identifizierung des konkreten Objekts (in diesem Fall einer digitalisierten Zeitungsausgabe) dient.

Optionaler Suffix

In ARK-Persistent Identifier sind Suffixe optionale Elemente, die zusätzliche Informationen über die identifizierte Ressource liefern. Sie sind ein flexibles und vielseitiges Mittel, um im Hinblick auf die Identifizierung einer Ressource einen zusätzlichen Kontext und mehr Granularität zu bieten, und erlauben dem Nutzer, je nach Bedarf unterschiedliche Aspekte oder Varianten einer Ressource zu spezifizieren und darauf zuzugreifen (unterschiedliche Versionen, Formate oder Teile eines größeren Ganzen). Während der Core Identifier durchweg zur selben Ressource oder deren Metadaten führt, kann es eventuell sein, dass die erfolgreiche Umleitung der Suffixe nicht immer sichergestellt ist, da sie oft von den Fähigkeiten der konkreten Zugangsplattform abhängt.

Für luxemburgische Einrichtungen

Jede Einrichtung in Luxemburg, die digitale Sammlungen verwaltet, kann vom Persistent-Identifier-Dienst profitieren. Allerdings müssen sie sich einverstanden erklären:

  • ARK-referenzierte URLs zu aktualisieren, falls sich die Zugangslinks ändern;
  • die langfristige digitale Erhaltung ARK-referenzierter Objekte sicherzustellen;
  • ein System einzurichten, um zu erklären, warum ein Objekt nicht zugänglich ist, wenn es entfernt wurde;
  • die Zugänglichkeit ARK-referenzierter URLs im Internet zu gewährleisten, wobei entweder Zugang zum digitalen Objekt gewährt wird oder die Zugangsbedingungen bereitgestellt werden.

Das Nationalarchiv (NAAN 76610) und das Musée national d’archéologie, d’histoire et d’art (Nationalmuseum für Archäologie, Geschichte und Kunst) (NAAN 72849) sind die ersten Institutionen, die den Persistent-Identifier-Dienst nutzen.

Nutzung in der BnL

Mit der Einführung des ARK als Persistent-Identifier-Format und dem Anbieten dieses Dienstes begann die BnL ARKs zuzuteilen und umzuleiten. Anfänglich konzentrierte sich diese Initiative auf über eluxemburgensia.lu verfügbare digitalisierte Dokumente, mit über 100.000 ARKs, die digitalisierten Tages- und Wochenzeitungen, Handschriften, Büchern, Plakaten und Postern zugeordnet waren.

Im Laufe der vergangenen Jahre ist die Zuordnung von ARK-Persistent Identifier in der Nationalbibliothek zur Routine geworden. Heute kommen unterschiedliche Materialien wie digital entstandene Publikationen, bibliographische Einträge, Autoritätsdateien und bestimmte Webseiten oder Policy-Dokumente für die Zuteilung von ARKs in Frage.

Gleichzeitig hat die Nationalbibliothek die umfangreiche Aufgabe übernommen, früher verwendete Verweise auf verschiedenen Plattformen wie dem a-z.lu-Portal und der BnL-Website durch ARKs im persist.lu-URL-Format zu ersetzen.

Zum letzten Mal aktualisiert am