Le monde de l'édition > Reportages

Distributed Proofreaders, producteur des livres du Projet Gutenberg, a 10 ans

Par Marie Lebert,Le jeudi 04 novembre 2010 à 13:45:22 - 0 commentaire

12

  • Zoom moins
  • Zoom plus
  • Signaler erreur
  • Imprimer
  • Envoyer à un(e) ami(e)

illustration

Le Projet Gutenberg est un projet visionnaire lancé par Michael Hart en juillet 1971 pour créer des versions électroniques d’oeuvres littéraires et les diffuser gratuitement dans le monde entier. Ce projet trouve un second souffle et un rayonnement international avec l’apparition du web en 1990 puis la création de Distributed Proofreaders en 2000, pour partager la relecture des livres entre des milliers de volontaires.

Les volontaires choisissent un livre en cours de traitement – disponible donc sur le site - pour relire et corriger une page donnée. On peut arrêter au bout d'une page, ou bien en relire plusieurs. Chacun travaille à son propre rythme. À titre indicatif, il est conseillé de relire une page par jour. C’est peu de temps sur une journée, et c’est beaucoup pour le projet. Une page multipliée par des centaines de volontaires représente un chiffre considérable.

Un site lancé en 2000


Distributed Proofreaders est conçu en octobre 2000 par Charles Franks pour contribuer à la numérisation des livres du domaine public. À partir du site web, on accède à un logiciel permettant à plusieurs correcteurs de travailler simultanément au même livre, chacun travaillant sur des pages différentes, le but étant bien sûr de travailler tous ensemble – de n'importe quelle région du monde - pour accélérer de manière sensible le processus de révision des livres.


Censé à l'origine aider le Projet Gutenberg dans sa tâche, Distributed Proofreaders devient rapidement la principale source des livres du Projet Gutenberg. Après avoir été affilié au Projet Gutenberg en 2002, il devient une entité indépendante en mai 2006, tout en conservant des liens étroits avec le Projet Gutenberg.

Distributed Proofreaders comptabilise 3.000 livres numérisés et corrigés en février 2004, 5.000 livres en octobre 2004, 7.000 livres en mai 2005, 10.000 livres en décembre 2006, 11.950 livres en janvier 2008 et 18.848 livres le 15 octobre 2010. La production était de 196 livres en octobre 2010.

Comment cela se passe, pratiquement


Le volontaire relecteur commence par s’inscrire. Il reçoit des directives détaillées. Ces directives concernent par exemple les parties en gras, en italique et soulignées, ou les notes, qui sont toutes traitées de la même manière. Un forum permet de poser des questions et de demander de l’aide à tout moment.

Quand le relecteur se connecte au site, il sélectionne le livre de son choix à partir d'une liste donnée. Une page du livre choisi apparaît simultanément dans deux versions : d’une part l’image scannée, d’autre part le texte issu de cette image, produit par un logiciel OCR. Le relecteur compare les deux versions et corrige les différences. Un logiciel OCR étant fiable à 99 %, cela représente une moyenne de dix erreurs à corriger par page. Le relecteur sauvegarde ensuite la page, et peut ensuite soit cesser le travail, soit opter pour la correction d'une autre page.
  • Tous les livres sont relus et corrigés deux fois de suite et la deuxième fois, uniquement par des correcteurs expérimentés.
  • Les pages corrigées sont ensuite formatées et assemblées selon des règles précises par d'autres volontaires (appelés «post-processors») pour obtenir un ebook.
  • Durant la totalité du processus, le traitement d'un livre donné est suivi par un responsable (appelé «project manager»), qui s'assure du bon déroulement des opérations.
Après la mise en forme suit la mise en ligne sur le Projet Gutenberg, avec indexation (titre, sous-titre, auteur, numéro de l'ebook et format d'encodage) par des volontaires indexeurs puis catalogage (dates de naissance et mort de l'auteur, classification de la Library of Congress, etc.) par des volontaires catalogueurs.

Toute participation est bienvenue


De nouveaux volontaires sont bienvenus, dans tout pays et pour toute langue, y compris pour les livres en français, et seront guidés par des volontaires expérimentés pour leurs premiers pas en tant que réviseurs. La tâche est immense, et toute aide est très appréciée.


Comme indiqué sur le site en 2005, « DP ne s'attend pas à un engagement inconditionnel de votre part. Corrigez des textes aussi souvent que vous le voulez, et le nombre de pages que vous voulez. Nous encourageons les gens à corriger une page par jour, mais vous êtes tout à fait libre de faire ce qui vous plaît. Nous espérons que vous vous joindrez à notre mission de 'préserver la littérature mondiale dans une version gratuite et disponible pour tous'. »

Distributed Proofreaders Europe


Distributed Proofreaders Europe (DP Europe) – calqué sur le site original de Distributed Proofreaders, dont il utilise le logiciel – est lancé en janvier 2004 pour gérer la relecture partagée du Projet Gutenberg Europe, sous l'égide du Projet Rastko à Belgrade (Serbie).

Dès ses débuts, DP Europe est un site multilingue. Ses pages principales sont traduites dans les grandes langues nationales européennes par des traducteurs volontaires. Le site de DP Europe est disponible en douze langues dès le mois d'avril 2004. L'objectif à long terme est soixante langues, avec prise en compte de toutes les langues européennes.

En mai 2005, DP Europe fête son centième livre numérisé par ses soins. Les livres sont en plusieurs langues pour refléter la diversité linguistique prévalant en Europe. 600 livres sont prêts en février 2009 et 732 livres le 15 octobre 2010.

DP Europe utilise l'Unicode pour pouvoir traiter des livres dans un grand nombre de langues. L'Unicode, créé en 1991, est un système d’encodage qui attribue un code unique à chaque caractère pour toutes les langues de la planète, et qui remplace peu à peu l'ASCII, un système d'encodage datant de 1968 et qui ne peut traiter que l'anglais et le latin dans sa version «originale», et quelques langues européennes avec accents dans sa version «étendue». En 2008, la moitié des fichiers disponibles sur l'internet sont encodés en Unicode.

Distributed Proofreaders Canada


Distributed Proofreaders Canada (DPC) débute ses activités en décembre 2007 pour la production des ebooks du Projet Gutenberg Canada (PGC), qui voit lui-même le jour quelques mois auparavant, le 1er juillet 2007, le jour de la fête nationale, sous l'égide de Michael Shepard et David Jones. Les cent premiers livres sont disponibles en mars 2008, avec des livres en anglais, en français et en italien. 250 livres sont disponibles en février 2009 et 427 livres le 15 octobre 2010.


Quelques chiffres
  • Plus de 33.000 livres pour le Projet Gutenberg, tous relus et corrigés deux fois, et dans plusieurs langues, le but étant plus la qualité que la quantité, avec une qualité avoisinant les 99,99% pour les livres issus de Distributed Proofreaders.
  • 18.961 ebooks traités par Distributed Proofreaders (le site original, basé aux États-Unis) le 1er novembre 2010, depuis son lancement en octobre 2000, et 2.352 volontaires actifs pendant le mois d'octobre 2010.
  • 739 ebooks traités par Distributed Proofreaders Europe le 1er novembre 2010, depuis son lancement en janvier 2004.
  • 433 ebooks traités par Distributed Proofreaders Canada le 1er novembre 2010, depuis son lancement en décembre 2007, avec 127 volontaires actifs pendant le mois d'octobre 2010.


Quelques liens

Distributed Proofreaders, qui vient donc de fêter ses dix ans, si vous souhaitez participer à la correction des livres.

Distributed Proofreaders Europe, l'antenne européenne lancée début 2004, avec une interface en plusieurs langues, dont le français.

Distributed Proofreaders Canada, lancé en décembre 2007, pour les Canadiens francophones qui nous lisent.

Les volontaires sont en fait bienvenus sur les trois sites – sans préférence géographique ni linguistique - la belle littérature n'ayant pas de frontières. Par exemple, si vous habitez Paris, vous pouvez bien entendu vous inscrire sur le site que vous voulez, et non pas obligatoirement sur le site européen.


À bientôt donc.

Copyright © 2010 Marie Lebert. Tous droits réservés. Pour diffusion en ligne sur ActuaLitté.

Mots clés :
ebooks - projet - gutenberg - distributed



Publier un commentaire

 

publier mon commentaire

Suivez-nous

Désinscription

Communiqué

Rencontre exclusive avec Ken Follett

Rencontres / Débats - Jeudi 16 octobre 2014 à 19h30 - A la librairie C’est un évènement de taille chez [...]

maestro diffusez vos communiqué sur actualitté

Profitez d'un vaste réseau de diffusion pour communiquer sur votre actualité, vos événements et vos parutions !
En savoir +

Sondage

Un abonnement pour les livres numériques, en illimité, ça vous inspire quoi ?

 

 

 

 

 

 

 

Voir les résultats

 

© 2007 - 2014 - actualitté.com