Communiqué de presse
Ce site utilise des cookies essentiels nécessaires à son bon fonctionnement, sans usage de données à caractère personnel, et ne pouvant pas être refusés. Des cookies non essentiels sont utilisés à des fins statistiques et seront activés uniquement si vous les acceptez. Consulter notre politique de confidentialité.
Le projet demande la numérisation de 124.630 pages de journaux historiques à partir de volumes papier. Il s’agit de 12 titres différents de la période de 1850 jusqu’à 2004. Le projet implique également la structuration des images en articles, la saisie de métadonnées par article, un OCR complet et la correction manuelle des titres d’article. Les standards à utiliser sont METS pour la structuration et les métadonnées, ALTO pour les coordonnées des mots issus de l’OCR, ainsi que TIFF, PNG et PDF pour les images, suivant les instructions du cahier spécial des charges et des documents complémentaires.
Dernière modification le