Un estudio de la Universidad de California en San Diego demostró por la capacidad de los grandes modelos de lenguaje (LLM) más modernos de pasar la prueba de Turing, esto es, hacerse pasar por humanos con éxito.
De hecho, ChatGPT, desarrollado por OpenAI, logró la mayor tasa de éxito al haber engañado en un 73 por ciento de las veces a los interlocutores de que estaban conversando con un humano real.
El estudio titulado Los grandes modelos de lenguaje superan el test de Turing, realizó la evaluación de 4 sistemas, de hecho ambos participantes mantuvieron conversaciones de 5 minutos simultáneamente con otro participante humano y uno de estos sistemas antes de juzgar qué compañero de conversación creían que era humano.
Según los resultados del estudio, GPT-4.5 logró convencer al interlocutor que era humano el 73 por ciento de las veces, superando significativamente al participante humano real.
“Esto sugiere que los interrogadores no sólo fueron incapaces de identificar al verdadero testigo humano, sino que, de hecho, fueron más propensos a creer que este modelo era humano que los otros participantes humanos”, indica el estudio.