Identifiants pérennes

Identifiants pérennes

La préservation à long terme des contenus numériques relève du défi ; cette situation est due à l’obsolescence technologique, aux défaillances matérielles et logicielles ou à l’altération des données, ainsi qu’au caractère temporaire et facilement modifiable des liens Web. Pour s’attaquer à ce dernier point, la Bibliothèque nationale a mis en place un système d’identifiants pérennes basé sur le format Archival Resource Keys (ARK), qui permet de garantir que les liens vers les ressources numériques du Luxembourg resteront toujours fiables et accessibles. Tout organisme situé au Luxembourg et gérant des collections numériques peut profiter de ce service.

Les principaux avantages

Le format ARK repose sur les principes fondamentaux suivants :

Large champ d’application

Des ARK peuvent être attribués à tout objet numérique, physique ou abstrait : documents et objets numérisés ou nés numériques, ensembles de données et publications (scientifiques), livres généalogiques, spécimens de musées, ressources éducatives, auteurs, savants, etc. Depuis 2001, plus de 1 000 organismes du monde entier, comprenant bibliothèques et archives nationales et universitaires, musées d’art, musées d’histoire naturelle, éditeurs, centres de données, organismes publics, marchands et laboratoires de recherche, se sont inscrits en vue de l’attribution d’ARK.

Pérennité

Les ARK garantissent l’accès continu aux informations numériques et, partant, la stabilité malgré les changements technologiques (comme les modifications d’URL d’accès en raison de mises à niveau de systèmes ou de migrations de formats) ou les changements organisationnels (par exemple le changement de nom d’un organisme). Améliorant la « citabilité » des liens, ils facilitent la capacité des usagers à référencer et à identifier des ressources numériques concrètes via des hyperliens, simplifiant ainsi la citation de ressources dans des contextes divers, comme les publications, les articles scientifiques, les pages Web ou les marque-pages (bookmarks), tout en maintenant la stabilité et la fonctionnalité des hyperliens dans le temps.

Non-réattribution

Une fois qu’un identifiant ARK a été attribué et relié à un objet, il restera unique pour une durée indéterminée. Même en cas d’effacement d’une ressource, il est essentiel qu’un ARK publié soit pérenne et dirige les utilisateurs soit vers les métadonnées de la ressource, soit vers une explication concernant son inaccessibilité. De plus, l’accès à une ressource de substitution peut être proposé à l’utilisateur.

Opacité

Les chaînes de caractères utilisées dans les identifiants pérennes sont généralement « opaques » (dépourvues de signification), révélant délibérément peu d’informations sur l’objet auquel elles ont été attribuées. Restant inchangés dans le temps, les identifiants opaques garantissent un accès permanent aux ressources numériques, même si leur emplacement ou leurs métadonnées changent. En s’abstenant de révéler des informations concernant la ressource sous-jacente, ils renforcent en plus le respect de la vie privée et la sécurité.

Metadonnées

Les métadonnées (les « données sur les données », c’est-à-dire des informations sur une ressource) facilitent beaucoup la compréhension et l’utilisation des identifiants opaques, qui ne contiennent aucune allusion aux objets qu’ils permettent d’identifier. Sans les métadonnées, la seule manière de connaître l’objet auquel l’ARK se rapporte serait d’y accéder directement. Que l’ARK redirige vers une page Web ou un fichier, les métadonnées fournissent des informations essentielles sur l’objet, comme sa date de création, son origine ou la disponibilité de versions plus récentes. Pour accéder aux métadonnées d’une ressource, il suffit d’ajouter « ?info » à l’ARK (exemple : https://persist.lu/ark:70795/tm9z0j?info). Bien que la création de métadonnées ne soit pas nécessaire, elle est vivement recommandée pour faciliter l’utilisation et la gestion des ARK.

Dans le cas du service des identifiants pérennes de la BnL, les métadonnées comprennent des informations sur l’organisme ayant créé les ARK, sur l’URL d’accès actuelle de la ressource en question et sur les date et heure de la création et de la dernière mise à jour de l’ARK. Pour faciliter la compréhension, ces métadonnées sont structurées de manière à fournir une réponse aux questions « qui ? », « quoi ? » et « quand ? ».

La Policy / persistence statement (« Politique / déclaration de pérennité ») expose les grandes lignes de l’engagement de l’organisme concernant les modalités de diffusion de la ressource, la question du changement éventuel du contenu dans le temps ou la durée de disponibilité.

Comment fonctionnent les identifiants pérennes ?

Un ARK comprend trois éléments principaux : le résolveur, l’identité immuable de base (appelée également nom de base de l’objet) et un suffixe facultatif.

Le résolveur

Un identifiant pérenne continue de fonctionner même si la ressource à laquelle renvoie le lien a été déplacée vers un autre site Web. Cela est possible grâce à un résolveur, qui sert de site Web spécialisé réorientant les identifiants vers l’emplacement actuellement le mieux approprié. Le site persist.lu sert de résolveur pour les ARK attribués aux organismes luxembourgeois. Pour assurer une redirection efficace, les institutions autorisées à attribuer des ARK doivent tenir leurs URL à jour en communiquant tout changement au résolveur.

Un résolveur combine un protocole (par exemple « https » ou « http ») et un nom d’hôte appelé nom de l’autorité d’adressage, parce qu’il s’agit d’un service qui accepte un nom comme donnée d’entrée et le renvoie (l’« adresse ») par exemple au contenu d’un objet, aux métadonnées de l’objet ou aux politiques relatives à l’objet. Bien que plusieurs options d’hébergement Web soient possibles, seuls certains domaines sont destinés à rester stables sur le long terme. Tant https://persist.lu/ark:70795/tm9z0j que https://viewer.eluxemburgensia.lu/ark:70795/tm9z0j mènent par exemple vers la même ressource (l’édition du 3 mai 2002 du journal hebdomadaire d’Lëtzebuerger Land), mais seule l’URL persist.lu fonctionnera certainement de manière inchangée pendant les décennies à venir.

L’identité immuable de base

Le nom de base de l’objet ou l’identité immuable de base comprend trois parties : l’étiquette « ark: », le Name Assigning Authority Number (numéro d’autorité nommante − NAAN) et le nom attribué à l’objet. Le NAAN est un numéro ou une chaîne de caractères permettant d’identifier un organisme créant ou attribuant des identifiants. Dans l’exemple ci-dessus, 70795 est le NAAN attribué à la Bibliothèque nationale, tandis que « tm9z0j » permet d’identifier l’objet concret (en l’occurrence, une édition de journal numérisée).

Les suffixes facultatifs

Dans les identifiants pérennes ARK, les suffixes sont des éléments facultatifs qui fournissent des précisions supplémentaires sur la ressource identifiée. Ils offrent un moyen flexible et polyvalent de fournir un contexte supplémentaire et d’apporter une plus grande granularité à l’identification des ressources, permettant aux utilisateurs de spécifier avec précision, en fonction de leurs besoins, différents aspects ou variantes d’une ressource (différents formats ou versions, parties d’un ensemble plus vaste) et d’y accéder. Tandis qui l’identité immuable de base mène invariablement à la même ressource ou à ses métadonnées, il est éventuellement possible que la résolution des suffixes ne soit pas toujours garantie, étant donné qu’elle est souvent tributaire des capacités de la plate-forme d’accès concrète.

Dans les organismes luxembourgeois

Tout organisme situé au Luxembourg et gérant des collections numériques peut profiter du service des identifiants pérennes. Il doit toutefois accepter de:

  • mettre à jour les URL référencées par des ARK si les liens d’accès changent ;
  • garantir la préservation numérique à long terme des objets référencés par des ARK ;
  • mettre en place un système permettant d’expliquer pourquoi un objet est inaccessible, lorsqu’il est supprimé ;
  • garantir l’accessibilité des URL référencées par des ARK sur Internet, soit en accordant l’accès à l’objet numérique, soit en fournissant les conditions d’accès.

Les Archives nationales (NAAN 76610) et le Musée national d’archéologie, d’histoire et d’art (NAAN 72849) sont les premières institutions à recourir au service des identifiants pérennes.

Utilisation à la BnL

En adoptant l’ARK comme format de ses identifiants pérennes et en proposant ce service, la BnL a commencé à attribuer et à résoudre des ARK. Au début, cette initiative portait surtout sur des documents numérisés disponibles sur eluxemburgensia.lu, comprenant plus de 100 000 ARK attribués à des quotidiens, hebdomadaires, manuscrits, livres et affiches numérisés.

Au cours des dernières années, l’attribution d’identifiants pérennes ARK est devenue pratique courante à la Bibliothèque nationale. Actuellement, différents matériaux comme les publications nées numériques, notices bibliographiques, notices d’autorité et certaines pages Web ou politiques d’accès sont susceptibles de recevoir des ARK.

En même temps, la Bibliothèque nationale a entrepris la tâche considérable de remplacer les anciennes références sur différentes plateformes, comme le portail a-z.lu ou le site Web de la BnL, par des ARK en format URL persist.lu.

Dernière modification le