Quand l'intelligence artificielle reconstitue des manuscrits éparpillés

Antoine Oury - 31.07.2019

Patrimoine et éducation - A l'international - Fragmentarium - intelligence artificielle manuscrits - patrimoine technologie


Les chercheurs qui se penchent sur des manuscrits anciens se retrouvent souvent bloqués par la fragmentation des sources : un morceau manquant peut interrompre le cours d'une recherche, d'une transcription ou d'une traduction. Pour faciliter les échanges et les reconstitutions, Enrique Jiménez, chercheur spécialisé dans les civilisations du Proche-Orient, travaille à une intelligence artificielle capable de croiser les sources pour réunir les pièces des puzzles...

078v-075r7p
(photo d'illustration, Ryan Baumann, CC BY 2.0)


Lorsque l'on traduit des textes écrits quelque part vers 2500 avant J.-C., Google Translate n'est pas d'une grande aide. Mais les technologies modernes ne manquent pas de ressources, tout comme les chercheurs. Enrique Jiménez travaille régulièrement sur des textes écrits à l'aide de signes cunéiformes, notamment en sumérien ou en akkadien, deux langues mortes autrefois parlées en Mésopotamie. 

Les sources restent limitées, pour de telles recherches, et s'avèrent de plus fragmentaires, le plus souvent. Et tout élément manquant fait courir le risque d'une voie sans issue : « Devoir abandonner un projet parce qu'un seul signe fait défaut est incroyablement frustrant, surtout lorsque vous savez que l'élément manquant est là, quelque part » témoigne Jiménez.

Au sein de l'université Ludwig Maximilian de Munich, Jiménez s'est mis au travail sur la réalisation d'une intelligence artificielle capable de croiser les sources depuis mai 2018, nommée « Fragmentarium ». Elle vise à réunir un maximum de fragments de manuscrits pour permettre à ceux qui les étudient de compléter un texte manquant grâce à un autre, conservé dans un musée quelque part dans le monde.

Pour le moment, le Fragmentarium rassemble environ 10.000 fragments de manuscrits, et le chercheur espère faire passer cette base de données à 15.000 documents d'ici la fin de l'année. Un objectif qui devrait rapidement être atteint : le British Museum entend par ailleurs confier quelque 40.000 fragments à l'IA de Jiménez d'ici 2025.
 

Toutes les possibilités à la fois


Entre-temps, le chercheur va entrainer son compagnon de recherche pour qu'il puisse « lire » au mieux les différents fragments et reconnaitre, puis traduire, les écritures cunéiformes : la rapidité que pourrait apporter le programme serait un apport inestimable aux recherches sur cette période de l'histoire, et plus largement sur les études archéologiques.

« Un ordinateur peut se saisir de toutes les possibilités imaginables à la fois, et comparer de manière automatique de nouveaux fragments avec des textes stockés au préalable », explique ainsi Enrique Jiménez. Il a lui-même testé sa machine sur un passage tiré d'un poème épique babylonien évoquant les souffrances d'un homme pieux — une thématique qui n'est pas sans rappeler l'histoire de Job.
 
« Nous sommes maintenant capables de décrypter ce passage, que personne n'avait pu lire depuis ces 2000 dernières années », se félicite-t-il. Ainsi, les intelligences artificielles ne servent pas qu'à annoncer la disparition future de métiers pris en charge par les robots, mais aussi à faire resurgir un passé que l'on croyait disparu à jamais...

Demain, l'intelligence artificielle pourrait aussi participer au décryptage de langages qui résistaient jusqu'à présent aux chercheurs, comme l'inexpliqué Linéaire A...


via TechXplore


Commentaires

Pas de commentaires

Poster un commentaire

 

grin LOL cheese smile wink smirk rolleyes confused surprised big surprise tongue laugh tongue rolleye tongue wink raspberry blank stare long face ohh grrr gulp oh oh downer red face sick shut eye hmmm mad angry zipper kiss shock cool smile cool smirk cool grin cool hmm cool mad cool cheese vampire snake exclaim question

Vous répondez au commentaire de

Cliquez ici pour ne plus répondre à ce commentaire

* Laisser vide pour ne pas reçevoir de notification par email de nouveaux commentaires.