Categorías: Google, Internet, Nuevas Tecnologias

El sistema que ofrece reCAPTCHA es para mi uno de los más eficaces para combatir SPAM con el uso de “Captchas”, al implementarlo en nuestro Foro de LudosLegio notamos un descenso realmente significativo con el registro de cuentas por parte de “bots”. Me sorprende leer en blog oficial de Google, que se han hecho con reCAPTCHA y más aún las astucia de la compañía por adquirir el servicio con dos intenciones.
La primera, y un tanto obvia por supuesto, es que continuarán el desarrollo de control de SPAM, con el objetivo de mejorarlo. Y que bien que Google lo adquiriera, pues ofrece algo de garantía de que tenemos el servicio para rato.
La segunda intención es la de implementar la tecnología de OCR (Reconocimiento Óptico de Caracteres)desarrollada por la compañía, a fin de mejorar el sistema con el que escanean los libros disponibles en Google Books y Google News Archive Search.

¿Tecnología OCR de reCAPTCHA haz dicho?, pues si, resulta que las palabras que utiliza reCAPTCHA en su sistema de verificación que varían de 2 a 3, forman parte de un proyecto para la digitalización de libros y documentos escaneados del Internet Archive de la escuela de Ciencias de la computación de la Universidad de Carnegie Mellon que pretende la revisión distribuida de los términos que no ha podido convertir a texto mediante el escaneo con el sistema OCR. Así pues, cuando introducimos las 2 palabras del CAPTCHA una es la de la verificación y la otra corresponde al fragmento que el sistema de OCR no pudo descifrar.
La integración de reCAPTCHA con Google Books y Google News Archive Search implica pues, que de los 2 CAPTCHAS que serán servidor a partir de ahora, 1 corresponderá a fragmentos de los documentos que Google ha escaneado. No queda duda que Google y su inversión en Google Books serán efectivas y rendirán frutos con la calidad de servicio que están en vías de ofrecer.

















