ReCaptcha : quand l’internet utilise les cerveaux humains
Voici deux problèmes qui n’ont apparemment rien en commun:
- beaucoup de sites internet ont besoin de s’assurer que celui qui remplit un formulaire est bien un humain, et pas un programme créé par un pirate pour abuser des possibilités du site
- il existe des tonnes de documents anciens difficilement lisibles que l’on souhaite numériser, mais les logiciels d’OCR (reconnaissance des caractères) ne sont pas assez efficaces.
Une solution au problème 1 courament utilisée est le « captcha » : on affiche une image contenant un texte assez déformé, et on demande à l’utilisateur de taper au clavier les lettres qu’il lit, ce qu’un programme ne peut pas faire.
L’idée géniale de ReCaptcha est d’utiliser ceci pour résoudre aussi le problème 2 : on présente à l’humain potentiel des mots scannés sur des documents illisibles et on lui demande de les taper. Les utilisateurs d’internet font donc le travail de rats de bibliothèque gratuitement ! Génial non ?
En pratique, il faut quand même valider à la fois l’humanité de l’utilisateur (problème 1) et la justesse de la lecture (problème 2), donc on présente 2 mots à lire, dont un que l’on connait pour l’authentification, et l’autre dont on compare statistiquement les lectures par de nombreuses personnes pour le valider.
Donc la prochaine fois que vous verrez une boite de dialogue comme celle ci-contre, vous serez doublement valorisés. D’une part vous ferez (enfin) un travail dont un ordinateur est incapable, et d’autre part, vous contribuerez à immortaliser des documents anciens.
Source: BBC NEWS | Technology | Spam weapon helps preserve books









[...] et les Captchas Il y a peu je vous expliquais ce qu’étais un captcha et comment certains avaient eu l’idée [...]
Ping par Melissa et les Captchas « Microclub | 9 novembre 2007 |
[...] et les Captchas Publié le 9 novembre 2007 par Dr. Goulu Il y a peu je vous expliquais ce qu’étais un captcha et comment certains avaient eu l’idée [...]
trouvé un programme capable de lire des captchas : http://www.cs.sfu.ca/~mori/research/gimpy/
une superbe video de Wired Science sur Luis Von Ahn, l’inventeur du ReCaptcha : http://www.pbs.org/kcet/wiredscience/video/284-luis_von_ahn.html
faut que j’écrive un autre article là dessus, c’est génial !
[...] Ahn est l’inventeur des ReCaptcha, dont j’ai déjà parlé ici. Dans la vidéo, il donne une information sidérante : il y a environ 200 millions de [...]
Google vient de racheter la technologie ReCaptcha
Et comme Google digitalise aussi des livres anciens…