La numérisation patrimoniale à l’INHA

La bibliothèque numérique de l’INHA s’enrichit toute l’année de nouvelles mises en ligne, à l’issue pour chaque document d’un travail long de plusieurs mois. Dans cette période où les ressources à distance prennent une importance toute particulière, nous souhaitons vous proposer une brève présentation de ce travail, qui représente une activité désormais bien implantée dans le monde des bibliothèques, sans être toujours bien connue du grand public.

Numériser, d’une page d’un document à des collections entières

Parmi les plus anciennes numérisations de l'INHA, ce livre de fête numérisé en 2004. Claude de La Ruelle, Dix grandes tables, contenantes les pourtraictz des cérémonies, honneurs et pompes funèbres, faitz au corps de feu Serenissime Prince Charles 3 du nom etc…, bibliothèque de l’INHA, collection Jacques Doucet, 4 RES 817. Cliché INHA
Parmi les plus anciennes numérisations de l’INHA, ce livre de fête numérisé en 2004. Claude de La Ruelle, Dix grandes tables, contenantes les pourtraictz des cérémonies, honneurs et pompes funèbres, faitz au corps de feu Serenissime Prince Charles 3 du nom etc…, bibliothèque de l’INHA, collection Jacques Doucet, 4 RES 817. Cliché INHA

La numérisation à l’INHA est une histoire déjà ancienne, puisque les premières opérations remontent à 2002. Actuellement, il existe deux types de numérisation dans l’établissement :

  • des numérisations effectuées dans le cadre du service de reproduction à la demande, sollicitées par un public varié, composé de particuliers, de chercheurs ou d’éditeurs pour illustrer une publication ;
  • des opérations concernant des corpus entiers, décidées par l’établissement en appui de sa politique scientifique, ou pour conservation ou valorisation de ses collections.

Dans le premier cas, il s’agit souvent de demandes concernant un seul document, dont parfois seule la numérisation partielle (une page ou deux) est demandée. Dans le second, il s’agit au contraire de collections entières, constituées de plusieurs dizaines et parfois plusieurs centaines de volumes. La numérisation à la demande se poursuit toute l’année, les autres opérations sont ponctuelles et durent plusieurs mois en continu. La dernière opération de ce genre remonte au printemps 2019, où nous avons travaillé à la numérisation d’environ deux cent livres de fête.

Un exemple de numérisation récente : ce manuel de dessin a été numérisé fin 2018. Louis Elle, Le Primatice, Le Livre original de la portraiture pour la jeunnesse tiré de F. Bologne et autres bons peintres, 1644, bibliothèque de l’INHA, collection Jacques Doucet, 4 EST 229. Cliché INHA
Un exemple de numérisation récente : ce manuel de dessin a été numérisé fin 2018. Louis Elle, Le Primatice, Le Livre original de la portraiture pour la jeunnesse tiré de F. Bologne et autres bons peintres, 1644, bibliothèque de l’INHA, collection Jacques Doucet, 4 EST 229. Cliché INHA

Le nerf de la guerre : moyens matériels et humains

Au sein du service de l’informatique documentaire, l’équipe de la cellule numérisation se compose actuellement de cinq agents permanents et d’une monitrice étudiante, qui interviennent à toutes les étapes de la chaîne de numérisation : sélection des documents, rédaction des constats d’état avant numérisation, prises de vue pour la reproduction à la demande, saisie des tables des matières pour permettre une navigation aisée dans le document mis en ligne… Toutes les décisions concernant la numérisation sont prises en concertation avec l’équipe du service du patrimoine, dont les chargés de collection assument une part importante du travail pour toutes les étapes en amont de la numérisation, et la surveillent directement pour les fonds particulièrement précieux.

La numérisation se fait en grande partie dans les locaux de la bibliothèque, qui dispose pour cela d’un atelier de reproduction équipé d’un scanner de type Copibook de la marque i2S. Cet équipement ne permet pas de numériser les documents de très grand format, mais permet la numérisation d’une grande majorité des documents de la bibliothèque, jusqu’au format A2. Il est équipé d’un lutrin, qui permet de caler le livre pendant l’opération dans le cas d’une numérisation à ouverture partielle, quand la fragilité de la reliure ne permet pas d’ouvrir le livre complètement.

La numérisation à la demande est effectuée par les membres de l’équipe, mais l’INHA fait appel à des prestataires extérieurs pour la réalisation des opérations de grande ampleur. Dans le cas des numérisations concernant des documents rares et précieux, le prestataire intervient sur site, en déléguant un opérateur qui vient travailler directement sur le matériel de l’INHA. Pour des documents de grands formats dépassant les capacités de notre scanner « domestique », le prestataire peut installer dans notre atelier un scanner de plus grande dimension.

La numérisation à l’initiative de l’établissement, du choix à la mise en ligne

Dans ce billet, nous allons revenir plus en détail sur la chaîne de traitement concernant les numérisations de corpus menées à l’initiative de l’établissement, sans nous attarder sur le traitement des demandes qui parviennent au service de reproduction à distance. Ces dernières posent un type de problème différent. Ici nous allons aborder la numérisation de documents anciens et tombés dans le domaine public.

La première étape est bien sûr celle du choix d’un corpus à numériser. Nous rappellerons ici brièvement les principes généraux de la politique documentaire de la bibliothèque numérique. Les corpus que nous retenons pour numérisation sont sélectionnés en prenant en compte les objectifs suivants :

  • répondre aux besoins de la recherche en mettant à disposition les différents types de sources exploitées : imprimés, manuscrits, documents graphiques ;
  • (re)donner accès à des sources difficilement consultables ou indisponibles ;
  • protéger certains documents fragiles ou uniques ;
  • valoriser et faire connaître les collections.

Les grandes orientations de la politique de numérisation sont discutées au sein d’un comité de la politique de numérisation, où sont représentées les différents métiers de l’établissement, bibliothécaires mais aussi chercheurs.  Le programme de numérisation peut être défini plusieurs mois, voire plusieurs années avant la numérisation effective. Ainsi, une grande partie du programme que nous suivons encore a été définie en 2018, à l’occasion du renouvellement du marché de numérisation qui a permis de choisir les prestataires actuels.

Actuellement, la question se pose toutefois des futures orientations à donner à notre politique de numérisation, afin de mieux articuler cette offre documentaire avec les évolutions et les besoins de la recherche en histoire de l’art, qui se développe dans des domaines actuellement peu couverts par la bibliothèque numérique. La constitution de nouveaux corpus est envisagé, concernant en particulier les thèmes suivants : l’histoire de l’art extra-européenne, en particulier celle de l’Afrique francophone, les livres spoliés, la France non métropolitaine. L’histoire de l’art européenne, déjà bien représentée dans les collections de la bibliothèque numérique, devrait faire l’objet d’une approche renouvelée, reflétant mieux les enjeux actuels de l’écriture de cette histoire.

Après la définition du corpus sur lequel on va travailler, vient l’étape de la sélection documentaire proprement dite. Elle consiste à lister les exemplaires « candidats » à la numérisation dans le fonds. Avant d’ajouter un livre à cette liste, on s’attache à vérifier qu’un autre exemplaire du même document n’a pas été numérisé et mis en ligne par un autre établissement, afin de ne pas refaire inutilement un travail déjà fait. Si le livre est déjà disponible dans une autre bibliothèque numérique, on ne numérisera l’exemplaire de l’INHA que si ce dernier présente des particularités d’exemplaire intéressantes : reliure historiques, annotations manuscrites, etc… Quand la bibliothèque possède plusieurs exemplaires du même document, il faut aussi déterminer lequel est le plus apte à être numérisé, en vérifiant son état matériel, ou lequel est le plus intéressant d’un point de vue historique, en prenant en compte l’intérêt de la reliure par exemple.

Quand la liste des documents à numériser est stabilisée pour un corpus, on peut passer à la rédaction du constat d’état avant numérisation, qui est une étape particulièrement importante dans le cadre d’une numérisation effectuée par un prestataire. Ce document, établi par la bibliothèque et ensuite vérifié par le prestataire lors de sa prise en charge du document, va servir à vérifier après la numérisation que le document n’a pas été endommagé pendant l’opération. Le constat d’état sert également à transmettre au prestataire les consignes techniques à appliquer au cours de la numérisation, telles que le cadrage, la résolution d’acquisition ou le degré d’ouverture du document durant la prise de vue, selon que son état permet une numérisation en ouverture complète ou partielle. C’est donc au moment de la rédaction de ce constat que sont prises les décisions les plus importantes concernant le résultat final de la numérisation.

Au moment du constat d’état sont repérés les documents qui nécessitent des interventions préalables de restauration avant numérisation, afin d’éviter que celle-ci n’endommage le document. Les opérations les plus souvent nécessaires sont la consolidation de la reliure au niveau du dos, particulièrement éprouvé par la manipulation. L’INHA peut compter pour cela sur son propre atelier de restauration.

Enfin, vient le moment tant attendu (et préparé) de la numérisation. A ce stade, une partie des paramètres de numérisation ayant déjà été définie en amont, il ne reste plus qu’à les appliquer, tout en veillant soigneusement à la sécurité du document et à la calibration de l’appareil de prise de vue, afin de s’assurer que les couleurs captées par l’appareil sont bien fidèles aux couleurs du document d’origine. Pour cela, l’opérateur a notamment l’obligation de vérifier quotidiennement la calibration de l’appareil en numérisant tous les jours une charte colorimétrique.

L'opérateur de numérisation doit veiller chaque jour à numériser une charte colorimétrique de ce type, pour vérifier le rendu des couleurs de l'appareil de prise de vue. Source : Flickr / auteur : metalkpirate1day /  licence CC BY-NC-SA 2.0.
L’opérateur de numérisation doit veiller chaque jour à numériser une charte colorimétrique de ce type, pour vérifier le rendu des couleurs de l’appareil de prise de vue. Source : Flickr / auteur : metalkpirate1day / licence CC BY-NC-SA 2.0.

La durée de l’opération varie en fonction de la complexité des documents à numériser. Pour un fonds de documents complexes comme celui des livres de fête, avec de nombreuses planches dépliantes nécessitant des manipulations délicates pour la numérisation, et l’obligation d’utiliser des scanners de différentes capacités pour des documents de tailles différentes, le temps de numérisation sera évidemment plus grand. A titre d’exemple, cette dernière opération a duré près de quatre mois et s’est tenue d’avril à juillet 2019.

Ce travail en continu peut occasionner des erreurs, oubli de pages notamment. C’est pourquoi l’ensemble de ce travail est contrôlé au fur et à mesure de la numérisation par l’équipe de la bibliothèque numérique, puis une seconde fois lors de la livraison des fichiers définitifs.

Après la numérisation, le travail continue

Une fois le document numérisé, le travail n’est pas encore fini, et plusieurs opérations sont encore nécessaires avant de permettre la publication sur la bibliothèque numérique. Nous n’en citerons que deux, parmi celles dont les effets sont le plus visibles pour le lecteur.

D’une part, il faut que les documents fassent l’objet d’un traitement par un moteur de reconnaissance optique de caractère, qui permettra ensuite la recherche dans le texte des documents. C’est un traitement automatisé, peu consommateur en temps.

D’autre part, pour permettre une navigation aisée au sein du livre numérisé à travers la visionneuse de la bibliothèque numérique, une indexation fine du contenu du document est nécessaire, qui va permettre la création de la table des matières dans la visionneuse, ainsi que le repérage des planches illustrées. C’est une opération de saisie manuelle, dont la durée varie fortement en fonction de la structure du document à décrire.

Du choix du corpus à la mise en ligne, et en comptant toutes les différentes étapes, dont les échanges avec le prestataire pour correction, on peut estimer qu’un livre numérisé dans le cadre d’une opération portant sur un ensemble documentaire mettra au minimum un an avant d’être mis en ligne.

En cette période de confinement, signalons que les dernières étapes de ce long processus se prêtent particulièrement bien au télétravail, pour peu que l’accès distant aux serveurs de la bibliothèque soit assuré. En effet, une fois le document numérisé et les fichiers numériques contrôlés par l’équipe de la bibliothèque, les dernières étapes avant mises en ligne peuvent s’accomplir sans avoir le livre original en main. L’équipe de la cellule numérisation reste donc mobilisée pour mettre à disposition du public les importantes réserves de documents numérisés que le service, prévoyant, s’est constitué de longue date…

 Johann Gillium
service de l’Informatique documentaire

Publié par jgillium le 29 avril 2020 à 13:00