Lecture numérique > Acteurs numériques > Actualité
L'outil antispam Captcha sert à la numérisation de livres anciens
Une nouvelle vie pour un outil qui fête ses huit ans...
Par Clément S., le vendredi 15 août 2008 à 06:13:15 - 1 commentaire
12
L'antispam au secours des livres
Conçu voilà huit ans pour empêcher les ravages du spam dans les boîtes à courriel, Captcha est actuellement en cours d'évolution et servira prochainement à transcrire les journaux et manuscrits aux lettres passablement... déformées. Sa sécurité n'est pas de 100 %, et l'on rapporte çà et là des systèmes de robots qui en sont venus à bout, mais dans l'ensemble, ça freine bien.
Le système, pensé par Luis von Ahn, à l'origine du modèle Captcha, et qui supervise la numérisation de livres dans 70 universités, a ainsi proposé d'ouvrir son système à qui veut s'inscrire et permettra alors d'aider à la numérisation. En effet, les personnes vont scruter le mot affiché, proposer leur version et par recoupement, Captcha relaiera à un ordinateur le mot mystère. Cela aiderait alors à la numérisation de 160 livres par jour.
reCAPTCHA, version reloaded !
Le nouveau système, modestement baptisé reCAPTCHA servira pour des livres publiés avant 1900 et serait doté d'une efficacité de 80 % de réussite. En passant par une phase de reconnaissance optique de caractère (OCR), on s'appuiera ensuite sur la base de données de référence pour décoder le mot qui pose problème.
« Environ 60 millions de Captcha sont utilisés à travers le monde chaque jour - chacun prenant environ 10 secondes. Par personne, cela ne représente pas grand-chose, mais bout à bout, ces puzzles impliquent 150.00 heures de travail », explique von Ahn.
Encore à perfectionner
Si la numérisation et la reconnaissance tendant de toute manière à être perfectionnées, elles semblent tout de même plus attentives que les opérations de numérisation de masse. Du côté de Google, quand on ne numérise pas à la main, on se sert d'un logiciel de détection maison, ainsi que sur la reconnaissance humaine. Mais on refuse de dire si reCaptcha pourrait devenir un partenaire...
Par Clément S., le vendredi 15 août 2008 à 06:13:15 - 1 commentaire
Mots clés :
Captcha -
reCaptcha -
numérisation -
spam
Publié par William
comme quoi le captcha est utile... moi je m'étais dit que ça ferait un très bon générateur de noms de domaine, dans ton exemple on aurait "overlooks.com" d'intéressant... enfin bref. Quoiqu'il en soit, moi je dis stop au captchas incompréhensibles : http://fanurl.com/00
Publier un commentaire
Reportages
"Bob Stein : lecture, écriture, 'Il nous faut construire un écosystème neuf'"
Penseur - panseur - de l'édition numérique
Interviews
"Nicci French : « Si on commence à se sentir en sécurité, il est temps d'arrêter »"
Pour la sortie de Lundi Mélancolie, Nicci French laisse pénétrer une intimité du double, de la fragilité et de la solitude. Avec ce qu'il faut d'humour.
Interviews
""Satellite Sisters est mon premier vrai thriller de science-fiction" (Maurice G. Dantec)"
Le retour d'un grand auteur
Interviews
"Jean-Daniel Magnin : "Je suis passionné par la question du monstre""
L'homme qui voulait écrire Matrix sans le voir...
Précédentes Suivantes
Suivez-nous
Communiqué
Les jeunes et les inégalités numériques
Colloque organisé par Lecture Jeunesse Centre de ressources, de formation, sur le livre et la lecture à destination des...
Profitez d'un vaste réseau de diffusion pour communiquer sur votre actualité, vos événements et vos parutions !
En savoir +
Sondage






























Réactions