Transcription participative de manuscrits pour les universités d'Iowa

Antoine Oury - 08.11.2014

Patrimoine et éducation - A l'international - universités Iowa - DIY History - transcriptions manuscrits


Baisse de budgets, manque de personnel, et somme innombrable de documents à transcrire, après numérisation : les universités cherchent de nouveaux moyens pour allier rapidité et qualité dans le traitement de leurs archives. Depuis 2011, les universités de l'Iowa ont mis en place une plateforme participative de transcription de documents.

 

 

 

Pour la transcription de ses propres numérisations, Google s'appuie sur l'outil de Captcha, étape qui permet de vérifier la qualité humaine d'un usager, en lui demandant de transcrire un texte visuel. L'image utilisée provient généralement d'un document ancien, et permet de produire une transcription, au fur et à mesure, avec la coopération involontaire des internautes.

 

Mais cette solution a été progressivement abandonnée, au profit d'un texte généré, aux caractères tordus, qui peut également être lu à voix haute, pour des questions d'accessibilité.

 

L'outil reCaptcha s'avère cependant efficace, et il est désormais utilisé, entre autres, par le site Internet Archive, à des fins de transcription de documents numérisés. Le tout permettant de transformer une simple image d'une page de livre en une véritable transcription numérique, avec métadonnées, recherche dans le texte et tutti quanti.

 

Les universités de l'Iowa ont vu encore plus grand, en mettant en place dès 2011 une plateforme, DIY History (pour 'Do It Yourself'), qui offre aux internautes la possibilité de participer à la transcription des livres numérisés. Plusieurs catégories de documents sont disponibles, pour que les volontaires adaptent leurs choix à leurs goûts personnels. Une fois la première transcription effectuée, les internautes sont invités à fournir une évaluation, et à corriger ou ajouter les informations nécessaires.

 

Ce projet de transcription participative devait au départ être temporaire, et ne concerner que des documents relatifs à la Guerre civile. Mais, avec 15.000 documents transcrits en quelques mois, les universités ont vite compris qu'une véritable demande s'était créée. En octobre 2012, la plateforme ouvrait ses portes, avec de nouvelles collections ajoutées de jour en jour.