Traductions Google pour Wikipédia pas si philanthropiques

Clément Solym - 16.07.2010

Patrimoine et éducation - Scolarité France - Wikipédia - Google - traduction


Géant de la recherche en ligne, Google participe activement dans la traduction d’articles de l’encyclopédie participative mondialement connue. Une collaboration utile puisque le haut des premières pages de résultats affichent régulièrement des contenus de Wikipédia. Second avantage, il permet au fond global de l’encyclopédie libre de s’étoffer sans reprendre à zéro la rédaction d’un article dans une nouvelle langue.

« Depuis 16 mois, Google travaille avec la fondation Wikimedia, des étudiants, des professeurs, des volontaires Google, des traducteurs professionnels et des membres de la communauté Wikipédia pour accroître le nombre de contenus en arabe, en langues d’Inde et en swahili », a expliqué un représentant de Google lors de la Wikimania conference se déroulant ce week-end en Pologne.

Principal chantier en cours, la traduction en hindi, une des principales langues parlées dans le monde et qui souffre d’être faiblement présente dans l’encyclopédie ( uniquement 21.000 articles). A titre de comparaison, Wikipédia en anglais comptabilise plus de 2,5 millions d’articles.

Cette démarche serait extrêmement généreuse si elle n’était pas financièrement très lucrative. En proposant ses services, Google renforce son moteur de traduction.

Outil de traduction reposant sur les comparaisons d’occurrences de termes pour les traduire de manière la plus heureuse, Google profite d’un grand nombre de données pour affiner les algorithmes.
D’autant plus lorsqu’il s’agit de millions de phrases que constitue le chantier de traduction Wikipédia. Travail effectué par des humains qui accentue sa fiabilité.


L’ingéniosité de cette opération vient surtout du fait que le Google Translation Kit permet l’importation de wikipages entières en vue de les traduire. "Aveu" confirmé dans la notice de l’outil en question qui précise : « Les segments traduits pour les pages Wikipédia sont entreposés dans notre mémoire de partage de traduction ».

On retrouvera une présentation de ce travail ici, également exposée lors de la Wikimania conference en Pologne le week-end dernier.