El GPT-4 de OpenAI, un modelo de inteligencia artificial (IA) generativa, ha superado la prueba de Turing, según el cofundador de Ethereum, Vitalik Buterin.
La prueba de Turing es un punto de referencia nebuloso para los sistemas de IA que pretende determinar el grado de similitud humana de un modelo de conversación. El término fue acuñado por el famoso matemático Alan Turing, que propuso la prueba en 1950.
Según Turing, en aquella época, un sistema de IA capaz de generar un texto que engañara a los humanos haciéndoles creer que estaban manteniendo una conversación con otro humano demostraría la capacidad de "pensamiento".
Casi 75 años después, la persona a la que se atribuye en gran medida la concepción de la segunda criptomoneda más popular del mundo ha interpretado una reciente investigación preimpresa de la Universidad de California en San Diego como un indicio de que la prueba de Turing ha sido finalmente "superada" por un modelo de producción.

Investigadores de la Universidad de California en San Diego acaban de publicar un artículo titulado "People cannot distinguish GPT-4 from a human in a Turing test" (La gente no puede distinguir entre GPT-4 y un humano en una prueba de Turing), en el que hacían interactuar a unos 500 sujetos humanos con humanos y modelos de IA en una prueba a ciegas para determinar si los sujetos podían averiguar cuál era cuál.
Según la investigación, los humanos determinaron erróneamente que GPT-4 era un "humano" el 56% de las veces. Esto significa que la máquina engañó a los humanos haciéndoles creer que era uno de ellos la mayoría de las veces.
La opinión de Vitalik Buterin
Según Buterin, un sistema de inteligencia artificial capaz de engañar a más de la mitad de los humanos con los que interactúa supera la prueba de Turing.
Por un reparto en Farcaster, discutiendo la reciente investigación preprint:
"¡Significa que la capacidad de las personas para saber si es un humano o un robot es básicamente lanzar una moneda al aire!"
Buterin matizó su afirmación con un comentario entre paréntesis: "De acuerdo, no del todo, porque a los humanos se les adivina como humanos el 66% de las veces frente al 54% de los bots, pero una diferencia del 12% es minúscula; en cualquier escenario del mundo real eso cuenta básicamente como aprobar".
También añadió más tarde, en respuesta a los comentarios sobre su elenco original, que la Prueba de Turing es "con mucho, el hito socialmente aceptado más famoso de "la IA es una mierda seria ahora". Así que es bueno recordar que ese hito ya se ha superado".
La prueba de Turing
La inteligencia artificial general (IAG) y la prueba de Turing no están necesariamente relacionadas, a pesar de que ambas terminologías se confunden a menudo. Turing formuló su prueba basándose en su perspicacia matemática y predijo un escenario en el que la IA podría engañar a los humanos haciéndoles creer que era uno de ellos a través de la conversación.
Cabe mencionar que la Prueba de Turing es una construcción efímera sin un verdadero punto de referencia o base técnica. No hay consenso científico sobre si las máquinas son capaces de "pensar" como los organismos vivos ni sobre cómo se mediría tal hazaña. En pocas palabras, la inteligencia general artificial o la capacidad de "pensar" de una IA no es actualmente mensurable ni está definida por las comunidades científica o de ingeniería.
Turing hizo sus predicciones conceptuales mucho antes de la llegada de los sistemas de inteligencia artificial basados en tokens y de la aparición de las redes generativas adversariales (GAN, por sus siglas en inglés), precursoras de los actuales sistemas de IA generativa.
Inteligencia general artificial
La idea de inteligencia general artificial (IAG), que a menudo se asocia con el Test de Turing, complica aún más las cosas. En lenguaje científico, una "inteligencia general" es aquella que debería ser capaz de cualquier hazaña basada en la inteligencia. Esto excluye a los humanos, ya que ninguna persona ha demostrado capacidades "generales" en todo el espectro del esfuerzo intelectual humano. Por lo tanto, una "inteligencia artificial general" tendría una capacidad de pensamiento muy superior a la de cualquier ser humano conocido.
Dicho esto, está claro que GPT-4 no se ajusta al perfil de una verdadera "inteligencia general" en el sentido estrictamente científico. Sin embargo, eso no ha impedido que los miembros de la comunidad de la IA se muevan de un lado a otro y utilicen el término "IAG" para referirse a cualquier sistema de IA capaz de engañar a un número significativo de humanos.
En la cultura actual, es típico ver términos y frases como "IAG", "similar a los humanos" y "supera la prueba de Turing" para referirse a cualquier sistema de IA que produzca contenidos comparables a los producidos por los humanos.
Aclaración: La información y/u opiniones emitidas en este artículo no representan necesariamente los puntos de vista o la línea editorial de Cointelegraph. La información aquí expuesta no debe ser tomada como consejo financiero o recomendación de inversión. Toda inversión y movimiento comercial implican riesgos y es responsabilidad de cada persona hacer su debida investigación antes de tomar una decisión de inversión.