Les caractères du yiddish désormais reconnaissables par un logiciel

Clara Vincent - 22.11.2019

Edition - Bibliothèques - Bibliothèque numérique - langue hébreu - Yiddish Book Center


Le Yiddish Book Center, situé dans le campus universitaire du Hampshire à Amherst, dans le Massachusetts (États-Unis) vient d’annoncer la mise à disposition de son nouveau logiciel de reconnaissance de caractères. Une innovation technologique encore inédite pour l’alphabet hébreu, qui permet de rechercher dans plus de 10.000 documents numérisés. 




Pour les universitaires du Yiddish Book Center, cela n’est rien de moins qu’une révolution, rapporte The Forward. Jochre (Java Optical Character Recognition), le programme de reconnaissance de caractères, leur ouvre en effet de nouvelles perspectives de recherches avec un gain de temps indéniable. 

Et de faire entrer la langue yiddish parmi les langues « comprises » par les outils numériques. Contrairement à l’alphabet anglais ou d’autres langues dérivées du latin pour lesquelles il existe déjà de tels logiciels, les textes en hébreu numérisés n’étaient en effet jusqu’à ce jour qu’accessibles en format PDF « brut », sans possibilité de reconnaissance des caractères.

Cette situation contraignait les universitaires à effectuer leur recherche en consultant les documents page par page. Désormais, par une simple recherche lexicale, Jochre pourra leur permettre en un rien de temps de répertorier une quantité de textes.

Le Yiddish Book Center doit cette avancée au linguiste et programmeur informatique Assaf Urieli. Ce dernier en a eu l’idée en 2009, peu après que le Centre avait mis en ligne sa collection de livres, qui réunit environ 10.000 ouvrages. La tâche n’a pas été des plus évidente, puisqu’il a fallu apprendre au logiciel à reconnaître les spécificités de l’alphabet hébreu, tant la grammaire que la graphie des caractères, qui a évidemment évolué au fil des siècles. 
 
Désormais, après plusieurs années de travail, son logiciel est capable d’identifier les lettres avec une précision de 97 %, indique The Forward. Assaf Urieli en a fait don au Yiddish Book Center, en émettant une seule condition à son président, Aaron Lansky : que Jochre soit accessible gratuitement à l’ensemble des bibliothèques disposant de textes yiddish. 

M.Lansky ne pouvait pas espérer mieux qu’un tel outil technologique, lui qui rêve depuis longtemps que l’ensemble de la littérature yiddish devienne plus facilement accessible au public. Il espère à présent que Jochre suscitera l’intérêt des institutions et autres centres d’archives de textes yiddish.


Commentaires
Glurps il semble que votre article fait une confusion entre la langue yiddish et l'hébreu, qui sont deux langues distinctes avec deux alphabets. Ce projet porte sur la reconnaissance de l'hébreu non?
Herta aurait mieux fait de ne pas se manifester! Elle ignore, semble-t-il, qu'un seul alphabet, l'hébraïque, s'utilise tant pour l'hébreu que pour le yiddish.
mea culpa, j'ai lu & réagi bcp trop vite et mal. C'est une très bonne nouvelle pour la diffusion de la littérature yiddish.
cheese grin cool smirk grin surprised grin Intéressant. J'aimerais recevoir un échantillon. La remarque de Herta est judicieuse.

Sh.B.
Bonjour, comment se procurer ce programme ? Où est-il disponible

?
Poster un commentaire

 

grin LOL cheese smile wink smirk rolleyes confused surprised big surprise tongue laugh tongue rolleye tongue wink raspberry blank stare long face ohh grrr gulp oh oh downer red face sick shut eye hmmm mad angry zipper kiss shock cool smile cool smirk cool grin cool hmm cool mad cool cheese vampire snake exclaim question

Vous répondez au commentaire de

Cliquez ici pour ne plus répondre à ce commentaire

* Laisser vide pour ne pas reçevoir de notification par email de nouveaux commentaires.