GPT-4, la última versión del chatbot de inteligencia artificial ChatGPT, puede aprobar pruebas de bachillerato y exámenes de derecho con puntuaciones que se sitúan en el percentil 90 y cuenta con nuevas capacidades de procesamiento que no eran posibles con la versión anterior.

 

Las cifras de los resultados de las pruebas de GPT-4 fueron compartidas el 14 de marzo por el creador OpenAI, revelando que también puede convertir en texto entradas de imagen, audio y vídeo, además de manejar "instrucciones mucho más matizadas" de forma más creativa y fiable.

"Aprueba un examen de abogacía simulado con una puntuación en torno al 10% de los mejores examinados", añade OpenAI. "En cambio, la puntuación de GPT-3.5 se situó en torno al 10% inferior".

Las cifras muestran que GPT-4 obtuvo una puntuación de 163 en el percentil 88 del examen LSAT, la prueba que los estudiantes universitarios deben superar en Estados Unidos para ser admitidos en la facultad de Derecho.

Resultados de GPT-4 y GPT-3.5 en una serie de exámenes estadounidenses recientes. Fuente: OpenAI

La puntuación de GPT4 lo situaría en una buena posición para ser admitido en una de las 20 mejores facultades de Derecho y sólo le faltan unas pocas notas para alcanzar las puntuaciones necesarias para ser admitido en facultades tan prestigiosas como Harvard, Stanford, Princeton o Yale.

La versión anterior de ChatGPT sólo obtuvo 149 puntos en el LSAT, lo que la sitúa en el 40% inferior.

GPT-4 también obtuvo una puntuación de 298 sobre 400 en el Examen Uniforme de la Abogacía (UBE), una prueba a la que se someten los estudiantes de Derecho recién licenciados y que les permite ejercer como abogados en cualquier jurisdicción de Estados Unidos.

Las puntuaciones en el UBE son necesarias para ser admitido a ejercer la abogacía en cualquier jurisdicción estadounidense. Fuente: National Conference of Bar Examiners

La antigua versión de ChatGPT tuvo problemas en esta prueba, terminando en el 10% inferior con una puntuación de 213 sobre 400.

En cuanto a los exámenes SAT Evidence-Based Reading & Writing y SAT Math que realizan los estudiantes de secundaria de EE.UU. para medir su preparación para la universidad, GPT-4 obtuvo una puntuación en el percentil 93 y 89, respectivamente.

El GPT-4 también destacó en las ciencias "duras", con puntuaciones muy por encima de la media en Biología AP (85-100%), Química (71-88%) y Física 2 (66-84%).

Resultados de GPT-4 y GPT-3.5 en una serie de exámenes estadounidenses recientes. Fuente: OpenAI

Sin embargo, su puntuación en Cálculo AP fue bastante media, situándose entre el percentil 43 y el 59.

Otra área en la que GPT-4 mostró carencias fue en los exámenes de literatura inglesa: tuvo puntuaciones entre el percentil 8 y el 44 en dos pruebas distintas.

OpenAI dijo que GPT-4 y GPT-3.5 tomaron estas pruebas de los exámenes de práctica 2022-2023, y que "ningún entrenamiento específico" fue tomado por las herramientas de procesamiento de lenguaje:

“No hicimos ningún entrenamiento específico para estos exámenes. Una minoría de los problemas en los exámenes fueron vistos por el modelo durante el entrenamiento, pero creemos que los resultados son representativos.”

Los resultados también provocaron temor en la comunidad de Twitter.

Nick Almond, fundador de FactoryDAO, les dijo a sus 14,300 seguidores de Twitter el 14 de marzo que GPT4 va a "asustar a la gente" y va a "colapsar" el sistema educativo mundial.

El ex director de Coinbase Conor Grogan dijo que insertó un contrato inteligente Ethereum en vivo en GPT-4, y el chatbot instantáneamente señaló varias "vulnerabilidades de seguridad" y esbozó cómo el código podría ser explotado:

Auditorías anteriores de contratos inteligentes en ChatGPT descubrieron que su primera versión también era capaz de detectar errores de código en un grado razonable.

Rowan Cheung, fundador del boletín sobre IA The Rundown, compartió un vídeo de GPT transcribiendo a código un sitio web falso dibujado a mano en un trozo de papel.

Aclaración: La información y/u opiniones emitidas en este artículo no representan necesariamente los puntos de vista o la línea editorial de Cointelegraph. La información aquí expuesta no debe ser tomada como consejo financiero o recomendación de inversión. Toda inversión y movimiento comercial implican riesgos y es responsabilidad de cada persona hacer su debida investigación antes de tomar una decisión de inversión

Sigue leyendo: