Communiqué de presse
Le projet demande la numérisation de 124.630 pages de journaux historiques à partir de volumes papier. Il s’agit de 12 titres différents de la période de 1850 jusqu’à 2004. Le projet implique également la structuration des images en articles, la saisie de métadonnées par article, un OCR complet et la correction manuelle des titres d’article. Les standards à utiliser sont METS pour la structuration et les métadonnées, ALTO pour les coordonnées des mots issus de l’OCR, ainsi que TIFF, PNG et PDF pour les images, suivant les instructions du cahier spécial des charges et des documents complémentaires.
Dernière modification le