Imprimés de travail du Conseil d'Etat
[1800-1814]
 
   Imprimés du Conseil d'Etat : Gérando, collection numérisée

Présentation de la collection numérisée

Fiche signalétique de la collection numérisée

Intitulé Les Imprimés de travail du Conseil d'Etat : la collection Gérando, Bibliothèque du Conseil d'Etat
Dates 1800-1814
Importance matérielle 3660 documents
Caractéristiques techniques
de la numérisation

L'intégralité de la collection Gérando a été numérisée en l'an 2000 grâce au mécénat de la Fondation Napoléon :

1. En mode image : chaque page des documents originaux a été scannée, et enregistrée sous forme d'image TIFF, group IV, bitonale, 300 dpi. Non diffusées.

2. En mode texte : l'intégralité du texte des documents, à l'exception de quelques tableaux complexes, a été saisie manuellement à partir des images scannées, avec une conformité à l'original de 99,99 % (une erreur pour 10 000 caractères). Diffusées sur ce site.

Instruments de recherche

1. L'inventaire général des imprimés du Conseil d'Etat : sélectionner dans le champ lieux de conservation : Bibliothèque du Conseil d'Etat.

2. Le moteur de recherche plein-texte qui indexe tous les mots de tous les documents.



Description détaillée

Le choix de la collection Gérando

La plus complète des collections non reliées
La collection originale comprend 3 661 documents, soit un total de 31 420 pages imprimées.

Description physique de la collection d'originaux
Il s’agit d’une collection intégrale d’imprimés de travail composée par un conseiller d’État dans l’exercice des ses fonctions.

La collection Gérando du Conseil d’État a été choisie pour des raisons pratiques : il s’agit de fascicules non reliés d’environ 25 x 21 cm, pourvus d’une large marge blanche vers l’extérieur et vers le bas : le texte ne couvre que 18 x 10 cm environ. Quelques imprimés possèdent toutefois un format plus allongé de 32 x 21 cm environ, mais le texte y garde le plus souvent la même disposition que dans les petits formats. Ces fascicules, toujours composés de bifeuillets, sont de taille très inégale, allant d’une seule page imprimée (pour 4 pages au total) à plusieurs centaines de pages, la pagination étant dans la plupart des cas imprimée. Les fascicules les plus volumineux ont des cahiers cousus ; pour les autres, les bifeuillets sont simplement emboîtés. Quelques tableaux de très grand format (A2 ou A3) se trouvent pliés à l’intérieur de certains documents.
La campagne de numérisation, d'une durée de 12 semaines, n'a donc pas exigé de lourdes manipulations sur les originaux, et n'a pas occasionné de dégradation du fonds.

 

Les choix techniques de numérisation et de diffusion

La numérisation s'est faite chez un prestataire extérieur : la collection Gérando a été transférée dans les locaux de la société Berger-Levrault à Nancy pour y être scannée. Les documents ont été scannés manuellement page à page en format A3, en noir et blanc (bi-tonal) avec une définition de 300 dpi : les images des doubles pages ainsi obtenues ont ensuite été redecoupées pour ne présenter qu'une page à la fois, et enregistrées en format TIFF avec une compression Group IV. Les images des pages de chaque document ont ensuite été enregistrées sous forme d'un fichier PDF multipage, nommé en fonction du code-barre apposé par la bibliothèque sur la première page du document original.

Les fichiers images ainsi obtenus ont ensuite été envoyés à un atelier situé à Madagascar, pays francophone, où ils ont servi de base à une double saisie manuelle en mode texte (1) : la saisie a été faite en Unicode. Le contrôle de qualité garantit un taux de conformité à l'original de 99,99 % soit d'une erreur pour 10 000 caractères. Les erreurs typographiques, fréquentes dans ces documents souvent composés dans l'urgence, ont été respectées. 45 documents contenant des tableaux complexes, pour lesquels la saisie en HTML se révélait particulièrement contraignante n'ont pas été saisis dans leur intégralité : il est alors proposé de consulter l'image de ces documents.

Le site napoleonica.org propose en ligne les documents numérisés en mode texte, pour d'évidentes raisons de confort de navigation (faible poids des fichiers texte) et de puissance de recherche (indexation possible), sauf dans le cas des tableaux complexes et des documents contenant des annotations manuscrites, proposés en mode image. Le logiciel gratuit Acrobat Reader est alors nécessaire pour visionner les documents.

 

Caractéristiques de la collection numérique

Numérisation en mode texte
Numérisation en mode image
Nom de fichier Nom du fichier et extension ".html" Nom du fichier et extension ".pdf"
Format HTML, jeu de caractère Unicode, convertis ensuite en ISO-8859-1 TIFF Group IV, enregistrés sous forme de fichiers PDF multipages
DTD HTML, légèrement augmentée  
Mode de numérisation Double saisie manuelle, fidélité à l'original de 99,99 % 1 bit (trait / bitonal)
Résolution

 

300 dpi
Quantité 3660 31 420 images 3660 fichiers
Nombre de pages / fichier   1 à 100
Taille de chaque fichier De 1 à 400 Ko. La moyenne s'établit aux environs de 30 Ko par fichier. De 100 à 8000 Ko
Utilisation Diffusion sur Napoleonica.org
Indexation plein-texte
Archivage, tirage de fac-simile à la demande, diffusion des tableaux complexes et des annotations manuscrites
Logiciel de visualisation nécessaire Navigateur version 4 et supérieure Acrobat Reader
Exemples Projet de loi sur les dépenses relatives aux Cultes – GER01448.html Projet de loi sur les dépenses relatives aux Cultes – GER01448.pdf


      
1)
L'utilisation de l'OCR (reconnaissance optique de caractères) n'a pas été retenue à la suite de tests ayant mis en évidence une qualité très médiocre des textes obtenus, du fait de la typographie ancienne, des taches d'humidité présentes sur certains documents et de la mise en forme complexe de certaines pages. [retour]