Traquer les poèmes publiés, dans les archives de journaux

Julien Helmlinger - 20.10.2014

Edition - International - Littérature américaine - Université du Nebraska - Presse - journaux


Depuis la fin du XVIIIe siècle et jusqu'à nos jours, l'histoire des États-Unis se trouve documentée au travers de la presse locale, mais ont également été publiés dans ces journaux de nombreux poèmes ayant illustré la vie et les préoccupations des Américains. Tout d'un lot d'œuvres parfois méconnues dont l'analyse, selon Elizabeth Lorang, professeure, assistante de recherche et responsable de projets numériques de sciences humaines pour l'université du Nebraska, pourrait changer l'histoire de la littérature du pays de l'Oncle Sam.

 

Crédits : Craig Chandler, University of Nebraska-Lincoln

 

 

Seulement, cette mine représente des millions de pages, une quantité de papiers depuis scannée et archivée, dans laquelle les chercheurs risquent de se perdre. Au sein de l'université du Nebraska, Elizabeth Lorang fait équipe avec Leen-Kiat Soh, professeur agrégé en sciences de l'informatique et de l'ingénierie, ainsi que des étudiants, afin de développer un logiciel permettant de retrouver cette poésie qui se cache dans les archives de journaux numérisés.

 

Comme l'explique Leen-Kiat Soh, ce qui semble un travail sans fin pour une recherche manuelle, devient possible à l'ère du numérique avec les ordinateurs et technologies du traitement d'image. Sur le principe des applications de fouille de texte (text-mining), qui permettent de retrouver des mots et des phrases dans du texte numérisé, le programme de traitement d'image permet quant à lui de localiser des images ou des contours de formes spécifiques.

 

Or lors de son projet de thèse, au moment de passer son doctorat, Elizabeth Lorang a dû fouiller des archives de journaux pendant 18 mois afin d'y déceler manuellement des poèmes. Elle s'était alors rendu compte que le contenu poétique était visuellement distinctif et donc reconnaissable dans une page de texte. « Il existe des différences dans les espaces, justifications et autres indices visuels. » De ce constat allait naître leur projet commun.

 

Le développement de leur outil de recherche nécessite néanmoins un financement. Quelque 60.000 premiers dollars, de subvention de lancement, leur ont alors été accordés par la National Endowment for the Humanities. Ce qui leur permet d'œuvrer avec deux étudiants de premier cycle à leur travail de programmation, pour parvenir à une application qui devrait leur permettre de déceler la quasi-totalité des poèmes qui se cachent dans les millions de pages de la Chronicling America Collection.

 

Un projet interdisciplinaire qui doit optimiser le potentiel d'efficience des bibliothèques numériques dans le cadre de la recherche en sciences humaines.