Vous avez sûrement déjà croisé le système de vérification humaine reCAPTCHA qui permet de lutter contre le spam, en retapant 2 mots écrits dans un formulaire. Mais saviez-vous que ce système permet de manière astucieuse de numériser des milliers de livres papier grâce à votre propre contribution ? En effet, sur les 2 mots que vous tapez, un seul est connu et vérifié.
L'autre n'est pas connu, mais en le proposant à des centaines d'internautes différents et en ayant toujours la même réponse de leur part, le système sait alors que l'association entre ce qui a été scanné et ce qui a été tapé par les internautes est correct. Et voilà comment on arrive à numériser des milliers d'ouvrages avec un système antispam ! L'OCR (système de reconnaissance des caractères automatique par informatique) n'est aujourd'hui pas assez au point pour être suffisamment fiable. En utilisant le cerveau humain, on arrive à de bien meilleurs résultats. Le slogan de la société (qui a été rachetée par Google) incarne bien le fonctionnement de ce système : "stop spam, read books".
Tous les commentaires (107)
@Zdouble, j'ai pas compris a 100% mais juste l'idee et je trouve sa fabuleux
Je sais pas vous, mais moi les captchat ça m'énerve quand on doit actualiser 3 fois pour réussir à avoir un mot correcte. Maintenant je saurais que je peux taper n'importe quoi haha
maintenant je vais écrire sans exactitude le deuxième mots pour arrêter de me casser la tête :p
Wahou ! Moi qui est passionné d'informatique, je trouve cet idée surprenante en effet il fallait y penser !
On ne va pas travailler pour google quand même!
Cette anecdote m'angoisse... Sommes-nous manipulables à ce point, on nous trompe pour numeriser (parfois illegalement) des millions de livres ???
C'est extrêmement énervant les captcha grrrr j'evites des sites rien que pour ça
Très ingénieux ce monsieur bravo !!!
Jmcaumdt..(je me coucherais avec un mal de tête) ;)
J'avais lu sur leur site que ce n'était pas obligatoire. A mon avi, on peut en mettre partout sur son site (sans raison apparente) sans obliger la saisie des caractères affichés (ou si, si l'on est sadique).
Il y a un très bon documentaire concernant justement un très grand debat entre les droits d'auteurs qui interfère avec les copies "injuste" de Google