Google ha anunciado en su blog la compra de Recaptcha.
![]()
Los captcha están pensados para validar el acceso o envio de datos (por ejemplo, formularios o comentarios en un blog), asegurando que quien está ejecutando la acción es un humano (que puede leer los caracteres) y no un programa malicioso (que tiene dificultades para conseguirlo).
¿Y esto qué interés tiene para Google? Sencillo: las palabras que aparecen en los Captcha de Recaptcha proceden de archivos escaneados de viejos periódicos y libros, por lo que cada vez que un humano teclea un Captcha está ayudando a mejorar los sitemas de reconocimiento de texto (Optical Character Recognition, OCR).
Miles y miles de humanos enseñando a las aplicaciones.
¿Cómo se consigue esto, si las palabras son desconocidas para los ordenadores? Porque solamente una de las dos palabras mostradas por Recaptcha es desconocida, y la otra es la que realmente se utiliza para la validación.
Una compra interesante que servirá de apoyo a los gigantescos proyectos de escaneado de Google: Google Books y Google News Archive Search.