Desde la llegada de los CAPTCHA, han evolucionado desde obstáculos molestos a rompecabezas complejos que son difíciles de resolver incluso para los humanos. Entonces, ¿qué hace una persona moderna cuando se enfrenta a dificultades para resolver algo? ¡Por supuesto que recurre a ChatGPT!
Enlaces rápidos
1. CAPTCHA tradicional
Comencé proporcionándole a ChatGPT algo de contexto previo. Las instrucciones de la IA son vagas y no quería que dejara de responder porque pensaba que la estaba usando para rastrear sitios web. Así que preparé la conversación usando este mensaje:
Te daré un conjunto de rompecabezas visuales y tendrás que resolverlos. ¿Eso suena bien?
Luego comencé con un CAPTCHA muy simple y antiguo. Era un CAPTCHA falso que literalmente decía "CAPTCHA falso". Hace una década, captchas como este eran la norma, pero han desaparecido en gran medida.
Envié la imagen a ChatGPT y obtuve una respuesta segura y correcta. Lo resolvió de inmediato, lo que puede explicar por qué ya no se utiliza este tipo de CAPTCHA.
2. El dilema de los números
Los CAPTCHA digitales son mis favoritos (como humano) porque son los más fáciles. Generalmente son solo números con una capa gráfica, como una línea, para confundir a los bots. Aunque ha perdido popularidad, todavía lo veo en los sitios web del gobierno. Por ejemplo, es posible que lo encuentres cuando reservas una cita o realizas un pedido en línea.
ChatGPT escribió el número de forma rápida y precisa. Sin dudarlo. Sin esfuerzo. ChatGPT es rápido y preciso al manejar estas pruebas, y yo también lo soy. Sin embargo, queda la duda sobre la eficacia de estas pruebas a la luz del continuo desarrollo de las tecnologías de inteligencia artificial.
3. Seleccione la bicicleta
Ahora, subamos la apuesta. Este tipo de CAPTCHA es el más común y el más confuso. Generalmente consta de una cuadrícula de imágenes de 3×3 y le pide que seleccione todos los cuadrados que contienen un determinado elemento, generalmente una boca de incendios, una bicicleta o un camión.
Para facilitarle las cosas a ChatGPT, le di una instrucción: Numere los cuadros del 1 al 9, de arriba a la izquierda a abajo a la derecha, y luego dígale cuál seleccionar.
Elegí una imagen difícil: una manguera contra incendios, pero las instrucciones me pedían que identificara bicicletas. Es una buena prueba para ver si ChatGPT caerá en la trampa.
No cayó en la trampa. Él respondió con seguridad que no había bicicletas, e incluso me pidió que hiciera clic en “saltar”. Bien hecho ChatGPT.
4. ¿Izquierda o derecha?
Esta prueba utilizó el mismo patrón de “seleccionar todo”, pero con una nueva incorporación: me mostró imágenes de aviones y me pidió que eligiera los que iban hacia la izquierda. El problema de estas pruebas es que las imágenes no son reales, sino generadas por inteligencia artificial.
uno Señales de imágenes generadas por IA Algunos de ellos no representan nada significativo. Esto es algo cierto en el caso de las imágenes de aviones en la prueba CAPTCHA a continuación. Si te fijas bien, parecen aviones, pero todos los detalles son erróneos.
Sin embargo, continuamos: un robot resuelve un desafío creado por otro robot, con el objetivo de evitar que otros robots lo hagan. Como referencia, la respuesta correcta es los cuadrados 1, 3, 4, 5 y 7. Como ya le había dado instrucciones a ChatGPT sobre cómo manejar los CAPT para seleccionar cuadros, simplemente le envié la imagen.
Esta vez, ChatGPT tropezó. Identificó correctamente la mayoría de los aviones que volaban hacia la izquierda, pero identificó incorrectamente los cuadrados 2 y 8, y también omitió el cuadrado 3.
Consideré brevemente si podría haber tenido en cuenta la imagen de muestra y comenzar a contar desde allí, pero eso habría dado como resultado diez cuadrados, mientras que ChatGPT solo identificó nueve cuadrados.
5. Caza de pingüinos
Esta imagen fue proporcionada para la verificación de seguridad de Amazon. Se mostraron seis cuadrados, de los cuales sólo uno contenía un pingüino. Sin embargo, las otras imágenes eran sorprendentemente similares en color y composición.
Honestamente, esto fue más fácil que el anterior, pero no proporcionó un ejemplo de cómo se vería un pingüino. Me pregunté si la falta de una referencia podría confundir a ChatGPT.
No sucedió. ChatGPT identificó correctamente al pingüino en el cuadro superior derecho y, con seguridad, incluso describió el CAPTCHA como “fácil” antes de solicitar un desafío más difícil. Bueno, eso se puede arreglar.
6. Flores y unicornios
Otro tipo común de CAPTCHA implica mostrar una imagen distorsionada y solicitarle que marque casillas que “coincidan con el tema”. En teoría, esto significa elegir imágenes que sean similares, ya sea en proximidad, tipo o categoría.
Este CAPTCHA contenía una imagen distorsionada de una flor rosa. Los nueve cuadrados incluían una mezcla de objetos no relacionados (altavoces, unicornios y coches antiguos) y dos cuadrados con flores rosas, que eran las respuestas correctas.
ChatGPT respondió rápidamente pero no respondió completamente correctamente. Identificó correctamente la imagen de muestra como una flor e incluso aplicó lógica de sonido para resolver el CAPTCHA. Sin embargo, aunque identificó correctamente la flor de la parte superior izquierda, no vio la flor de la parte superior derecha e identificó erróneamente un automóvil viejo en la parte superior central como una flor. ¿Cómo pueden las aplicaciones de la inteligencia artificial? Identificar plantas y sus tipos ¿Pero no puede distinguir entre una flor y un coche?
El hecho de que eligiera dos imágenes de la primera fila me hace preguntarme: ¿realmente reconoció las flores pero no las describió correctamente? En ambos casos, la respuesta final fue errónea.
7. elelefantes de papel
Recientemente me encontré con una extraña prueba CAPTCHA en Internet. El formato era el mismo (cuadrados que parecían una muestra), pero la muestra en sí era un elefante dibujado con hojas. Los cuadrados contenían diferentes animales, cada uno hecho con… pinceles diferentes.
Ni siquiera yo estaba seguro de cuál era la respuesta correcta. Como la muestra era verde, las hojas correspondientes también deberían ser verdes. Aplicando un poco de lógica humana, me quedaría con los cuadrados 2, 4, 6 y 8. Ahora es el turno de ChatGPT.
Me quedé en shock. ChatGPT obtuvo la respuesta exactamente correcta. No sólo eso, también recogió el texto rojo “Inténtalo de nuevo” y lo señaló inteligentemente.
Deja que esto se asiente en tu mente. Si una IA –si un robot– puede pasar un CAPTCHA de esta complejidad, ¿qué dice eso sobre las pruebas CAPTCHA en su conjunto? ¿No se supone que es una prueba de Turing práctica para separar a los humanos de las máquinas? Si la IA puede superar esto tan fácilmente… ¿qué sentido tiene?
8. الدائرة المفتوحة
Después de que ChatGPT demostró su valía al pasar CAPTCHAs para objetos reales, y aprobó fácilmente aquellos basados en letras y números, la prueba final a la que se enfrentó fue un CAPTCHA lleno de líneas, corchetes, círculos y letras, donde el objetivo era elegir el círculo abierto.
Dada la capacidad de ChatGPT para generar gráficos y analizar imágenes, este debería haber sido un desafío fácil. El fuerte contraste entre las líneas y el fondo hizo que fuera fácil detectar las formas. Si los humanos pueden resolver esto con relativa facilidad, seguramente ChatGPT también puede hacerlo.
Lo que ocurrió después me dejó atónito. ChatGPT utilizó herramientas no reveladas en pruebas anteriores: importó bibliotecas de Python, ejecutó código y detectó sistemáticamente formas y contornos en la imagen para filtrar letras.
Pero algo parecía extraño. ChatGPT buscaba “un círculo que no intersectara ninguna línea”. ¿Entendió mal la tarea? Tal vez pensó que "circuito abierto" significaba un circuito ininterrumpido en lugar de un circuito con un espacio real. Pensé que lo aclararía, pero los humanos tampoco reciben instrucciones adicionales.
Luego ejecutó otra ronda de código para descubrir todos los circuitos… y descubrió un número muy grande. Algunos de ellos no estaban presentes en la imagen original. ¿Fue esto? Alucinación de IA? ¿O había formas colocadas deliberadamente con baja transparencia, imperceptibles para el ojo humano, que engañaron a la IA?
Finalmente analizó los círculos y eligió una respuesta. Estuvo completamente equivocado. De hecho, dio la peor respuesta posible. A pesar de tardar casi un minuto en completarse (importar bibliotecas, ejecutar múltiples análisis de imágenes), este fue su mayor fracaso hasta el momento. Más esfuerzo, menos retorno.
¿Tiene problemas con una prueba CAPTCHA que no funciona? Aquí hay algunas cosas que puedes intentar para evitar al revisor humano:
Este conjunto de pruebas CAPTCHA constaba de ocho desafíos diferentes. ChatGPT respondió cinco correctamente y se equivocó en tres de ocho: una respetable tasa de éxito del 62%. Vale la pena señalar que los que fallaron fueron todos generados por inteligencia artificial.
Los CAPTCHA para el avión y la flor utilizaron imágenes generadas por IA. El rompecabezas del círculo abierto se generó aleatoriamente mediante código. Hay un patrón aquí: ChatGPT solo falla cuando intenta resolver acertijos generados por su tipo.
Esto plantea una pregunta interesante: ¿Son los robots nuestra única forma de detectar y disuadir a otros robots?