Du temps à perdre ? Comparer le vocabulaire commun des oeuvres

Clément Solym - 07.02.2009

Zone 51 - Insolite - vocabulaire - commun - oeuvres


L'outil n'est pas si banal qu'il y paraît et dans les laboratoires du Times on confectionne des instruments tout à fait délicieux. Ainsi, le Book Scraper recense 126 ouvrages écrits par 53 auteurs avec plus de 12,8 millions de mots à son actif.

On peut dès lors comparer le vocabulaire commun et la quantité de mots employés dans deux oeuvres, ou encore chercher le mot le plus long utilisé dans un livre.

Ainsi, on découvrira que 75 % du vocabulaire de Frankenstein - le livre, pas la créature, qui elle ne doit pas en posséder des masses - est utilisé dans Ulysses de James Joyce ou encore qu'ils comptent 5276 mots en commun. Merveille !


On peut également découvrir le nombre d'itérations d'un mot dans l'ensemble de la base de données et apprendre que c'est chez Shakespeare que le mot "death" revient le plus souvent, bien que ce ne soit pas lui qui l'emploie le plus, eu égard au nombre de livres écrits. Ce terme n'apparaît d'ailleurs qu'une fois dans Alice au pays des merveilles...

On vous laisse vous amuser vous aussi et découvrir ce que le Book Scraper peut apporter.