reCAPTCHA

Acá se tratan los temas de interés general.
Responder
Yenki
Admin
Mensajes: 16076
Registrado: Mié Feb 16, 2005 8:23 pm
Ubicación: La Plata, Argentina

reCAPTCHA

Mensaje por Yenki » Lun Ene 02, 2012 11:33 am

Orión en lo de Pop me habló de esto, yo lo desconocía y me gustó el tema así que le armo uno.


Aunque reCAPTCHA suena como un insulto, en realidad es un sistema para identificar a personas y distinguirlos de los programas informáticos que simulan ser usuarios.


CAPTCHA viene de Completely Automated Public Turing Test To Tell Computers and Humans Apart, lo que en criollo sería algo como Test de Touring Completamente Automatizado para Distinguir a Humanos y Computadoras, lo inventaron investigadores de la universidad de Carnegie Mellon en EEUU el primero en usarlo fue Yahoo en el año 2000.


En el 2009 Google compró reCAPTCHA que es una empresa que da este servicio gratis. El anuncio en el blog de Google por acá.
Lo sorprendente para mí fue conocer que usan este servicio para digitalizar textos.
Una de las dos palabras distorsionadas que aparecen al usar reCAPTCHA viene de un texto que ha sido escaneado.


Imagen


Cuando se digitalizan textos con Reconocimiento Óptico de Caracteres, (OCR en inglés), hay fallas, no se reconoce bien todo lo escaneado.

En el propio sitio web oficial informan como trabaja.
Traduzco:
reCAPTCHA mejora el proceso de digitalización de libros al enviar palabras que no pueden ser interpretadas por computaodoras a la web en la forma de CAPTCHAs para que los humanos las descifren. Más específicamente, cada palabra que no puede ser leída correctamente por OCR es puesta en una imagen y usada como CAPTCHA. Esto es posible pues la mayoría de programas de OCR te alerta cuando una palabra no es interpretada correctamente.
Pero si una computadora no puede leer un CAPTCHA, ¿cómo sabe el sistema la respuesta correcta al acertijo? Aquí cómo : Cada nueva palabra que no puede ser leída correctamente por OCR es dada a un usuario en conjunción con una palabra cuya respuesta es conocida. El usuario debe leer ambas palabras. Si resuelve aquella cuya respuesta se conoce, el sistema asume que la respuesta es correcta para la nueva. El sistema entonces da la nueva imagen a un número de otras personas, para determinar con mayor precisión , si la respuesta original fue correcta.

Tomado de acá.

Incluso ponen ejemplos de como se complican las cosas con algunos textos antiguos o poco definidos.


Me recordó mi charla de hace unos días, este artículo en La Nación.



¡Muy ingenioso!!

Yenki
Admin
Mensajes: 16076
Registrado: Mié Feb 16, 2005 8:23 pm
Ubicación: La Plata, Argentina

Mensaje por Yenki » Sab Abr 19, 2014 8:10 pm

Un algoritmo de Google reconoce muchos códigos CAPTCHA

Desde la G tienen un algoritmo que dicen identifica correctamente el 99,8 % de los acertijos visuales para reconocer textos deformados con reCAPTCHA.

Lo desarrollaron inicialmente para reconocer direcciones y números en su servicio Street View, el cual da imágenes en 360 grados de diferentes lugares tomadas a nivel del piso.

Paradójicamente para reconocer direcciones tiene una eficacia de 96 % y anda mejor con los rompecabezas alfabéticos de reCAPTCHA.


Fuente: techspot.com


Imagen



Por mi experiencia estos servicios mayormente son una porquería, cada vez son más inentendibles, los textos aparecen tan deformados, estirados, apretados , superpuestos, degradados... que es muy difícil para cualquiera deducirlos.
Algunos dan mucho trabajo para ser inferidos por lo complejos de entender.
Si los algoritmos son más eficientes que las personas estamos sonados, y no es una buena forma de comprobar que hay un humano del otro lado tratando de registrarse, bajar un archivo, acceder a un sitio, etc.
Sería bueno que esto ya deje de ser empleado, y busquen otra forma de evitar los programas de reconocimiento de texto que quieren evitar.




Otro dato, en Google buscan interpretar como texto las direcciones de los domicilios en las ciudades del mundo desde imágenes. Esto es, poder identirficarlas en forma unívoca.
De ahí a armar bases de datos con nombres de personas y las fotos de sus domicilios hay un paso.
Construyendo la Matrix...

Responder

¿Quién está conectado?

Usuarios navegando por este Foro: No hay usuarios registrados visitando el Foro y 8 invitados