Rentrée littéraire : La fashion week des libraires


La British Library s'attelle depuis quelques mois à numériser une importante collection de livres rares écrits en bengali. Cette mission s'inscrit dans le cadre d'un projet qui consiste à mettre en ligne les documents les plus rares de l'Asie du Sud. Un problème se pose cependant : traduire le bengali ancien en anglais...

 

The Bengali Book of English Verse Cover.jpg

Theodore Douglas Dunn (Public Domain)

 


C’est un travail long et ambitieux dans lequel s’est lancée la British Library : numériser environ 4 000 livres rares en bengali — plus de 8 000 pages. Le projet « Deux siècles d’impression indienne » a pour but de rendre disponibles au grand public gratuitement les documents les plus rares d’Asie du Sud.

 

« Pour le moment, nous avons numérisé 1 000 livres. Il y en a de tous les genres possibles et imaginables. On trouve des traités scientifiques, sur l’éducation, la religion, des livres de missionnaires envoyés en Inde, une traduction de la Bible », explique Tom Derrick, conservateur numérique du projet, à l’IANS (plus grande agence de presse de l’Inde).

 

Advice for Railway Travellers, qui donne des informations sur les chemins de fer, est l’un des livres les plus rares numérisés par la bibliothèque, écrits à l’époque de l’avènement des trains à vapeur. La collection de la British Library s’étend ainsi de 1713 à 1914, couvrant une large période riche en événements historiques ayant eu lieu en Inde.

 

 

 

Pour aider la British Library dans cette fastidieuse tâche, la Bibliothèque nationale d’Inde, mais également l’université de Jadavpur, l’institut d’art de Srishti ou l’université de Londres participent au projet, à leur manière. La British Library organise d’ailleurs un concours pour trouver une solution au problème qui suit la numérisation des ouvrages : leur traduction.

 

L’institution britannique souhaite mettre à profit la technique de l’OCR, technologie de reconnaissance informatique des caractères, pour transcrire automatiquement les textes du bengali à l’anglais. Mais ce n’est pas si simple : « Nous avons affaire à du bengali ancien, qui a changé au fil des années, la typographie est donc tout à fait unique. L’OCR que l’on trouve dans le commerce n’est pas optimisé pour ça, et reconnaît mieux les caractères occidentaux », selon Tom Derrick.


Des manuscrits japonais du XXe siècle en téléchargement gratuit
 

Une vingtaine d’institutions dans le monde entier s’attellent ainsi à trouver une réponse au problème. Cette question de la traduction est capitale, car la British Library compte s’adresser à un public le plus large possible, qui ne parle pas forcément le bengali. De même, il s’agit de contextualiser les œuvres.

 

L’université de Jadavpur met ses experts à disposition de la British Library pour identifier les documents rares et uniques, qui ne sont trouvables nulle part ailleurs. Fait amusant, les plus rares sont toujours les livres les moins épais, selon Abhijit Gupta, codirecteur de la School of Cultural Texts and Records à l’université.

 

Les carnets secrets de Léonard de Vinci numérisés et disponibles en ligne


« Le but de cette numérisation est de donner accès à des savoirs dont nous connaissions l’existence, mais auxquels nous ne pouvions accéder, eux qui sont répartis dans les bibliothèques du monde entier », explique-t-il. Les documents seront mis en ligne une fois le projet mené à son terme.

Via Millenium Post