GPT-4, la última versión del chatbot de inteligencia artificial ChatGPT, puede aprobar pruebas de bachillerato y exámenes de derecho con puntuaciones que se sitúan en el percentil 90 y cuenta con nuevas capacidades de procesamiento que no eran posibles con la versión anterior.
Las cifras de los resultados de las pruebas de GPT-4 fueron compartidas el 14 de marzo por el creador OpenAI, revelando que también puede convertir en texto entradas de imagen, audio y vídeo, además de manejar "instrucciones mucho más matizadas" de forma más creativa y fiable.
"Aprueba un examen de abogacía simulado con una puntuación en torno al 10% de los mejores examinados", añade OpenAI. "En cambio, la puntuación de GPT-3.5 se situó en torno al 10% inferior".
Las cifras muestran que GPT-4 obtuvo una puntuación de 163 en el percentil 88 del examen LSAT, la prueba que los estudiantes universitarios deben superar en Estados Unidos para ser admitidos en la facultad de Derecho.

La puntuación de GPT4 lo situaría en una buena posición para ser admitido en una de las 20 mejores facultades de Derecho y sólo le faltan unas pocas notas para alcanzar las puntuaciones necesarias para ser admitido en facultades tan prestigiosas como Harvard, Stanford, Princeton o Yale.
La versión anterior de ChatGPT sólo obtuvo 149 puntos en el LSAT, lo que la sitúa en el 40% inferior.
GPT-4 también obtuvo una puntuación de 298 sobre 400 en el Examen Uniforme de la Abogacía (UBE), una prueba a la que se someten los estudiantes de Derecho recién licenciados y que les permite ejercer como abogados en cualquier jurisdicción de Estados Unidos.

La antigua versión de ChatGPT tuvo problemas en esta prueba, terminando en el 10% inferior con una puntuación de 213 sobre 400.
En cuanto a los exámenes SAT Evidence-Based Reading & Writing y SAT Math que realizan los estudiantes de secundaria de EE.UU. para medir su preparación para la universidad, GPT-4 obtuvo una puntuación en el percentil 93 y 89, respectivamente.
El GPT-4 también destacó en las ciencias "duras", con puntuaciones muy por encima de la media en Biología AP (85-100%), Química (71-88%) y Física 2 (66-84%).

Sin embargo, su puntuación en Cálculo AP fue bastante media, situándose entre el percentil 43 y el 59.
Otra área en la que GPT-4 mostró carencias fue en los exámenes de literatura inglesa: tuvo puntuaciones entre el percentil 8 y el 44 en dos pruebas distintas.
OpenAI dijo que GPT-4 y GPT-3.5 tomaron estas pruebas de los exámenes de práctica 2022-2023, y que "ningún entrenamiento específico" fue tomado por las herramientas de procesamiento de lenguaje:
“No hicimos ningún entrenamiento específico para estos exámenes. Una minoría de los problemas en los exámenes fueron vistos por el modelo durante el entrenamiento, pero creemos que los resultados son representativos.”
Los resultados también provocaron temor en la comunidad de Twitter.
Nick Almond, fundador de FactoryDAO, les dijo a sus 14,300 seguidores de Twitter el 14 de marzo que GPT4 va a "asustar a la gente" y va a "colapsar" el sistema educativo mundial.
Assessment theory was a big chunk of my life for several years. I was banging on about this day coming many years ago. I literally sounded like the resident crank at the time.
— drnick ️² (@DrNickA) March 14, 2023
But… really this means that anything but invigilated assessment is over from this point on.
La teoría de la evaluación fue una parte importante de mi vida durante varios años. Hace ya muchos años que insistía en que llegaría ese día. Parecía literalmente el loco de la época. Pero... realmente esto significa que todo lo que no sea evaluación vigilada se acabó a partir de este momento.
El ex director de Coinbase Conor Grogan dijo que insertó un contrato inteligente Ethereum en vivo en GPT-4, y el chatbot instantáneamente señaló varias "vulnerabilidades de seguridad" y esbozó cómo el código podría ser explotado:
I dumped a live Ethereum contract into GPT-4.
— Conor (@jconorgrogan) March 14, 2023
In an instant, it highlighted a number of security vulnerabilities and pointed out surface areas where the contract could be exploited. It then verified a specific way I could exploit the contract pic.twitter.com/its5puakUW
Introduje un contrato Ethereum activo en GPT-4. En un instante, destacó una serie de vulnerabilidades de seguridad y señaló áreas de superficie donde el contrato podría ser explotado. A continuación, verificó una forma específica en la que podía explotar el contrato pic.twitter.com/its5puakUW
Auditorías anteriores de contratos inteligentes en ChatGPT descubrieron que su primera versión también era capaz de detectar errores de código en un grado razonable.
Rowan Cheung, fundador del boletín sobre IA The Rundown, compartió un vídeo de GPT transcribiendo a código un sitio web falso dibujado a mano en un trozo de papel.
I just watched GPT-4 turn a hand-drawn sketch into a functional website.
— Rowan Cheung (@rowancheung) March 14, 2023
This is insane. pic.twitter.com/P5nSjrk7Wn
Acabo de ver a GPT-4 convertir un boceto dibujado a mano en un sitio web funcional. Esto es una locura. pic.twitter.com/P5nSjrk7Wn
Aclaración: La información y/u opiniones emitidas en este artículo no representan necesariamente los puntos de vista o la línea editorial de Cointelegraph. La información aquí expuesta no debe ser tomada como consejo financiero o recomendación de inversión. Toda inversión y movimiento comercial implican riesgos y es responsabilidad de cada persona hacer su debida investigación antes de tomar una decisión de inversión
Sigue leyendo:
- KuCoin lidera una financiación de USD 10 millones para el emisor de una stablecoin en yuanes chinos
- Una confusión con SVB obliga al SVC Bank de la India a emitir una nota aclaratoria
- Circle "pudo acceder" a USD 3,300 millones de reservas de USDC en Silicon Valley Bank, según su CEO
- Pruebas de Tsukuba en la ciudad japonesa Sistema de votación basado en Blockchain
- Un acuerdo entre Bantotal y Bitex permitirá la realización de pagos internacionales con tecnología blockchain
- Encuesta SegWit2x: el 84% dice que la cadena principal dominará después de la bifurcación dura
- Investigaban a Signature Bank por lavado de dinero antes de su cierre, revela un informe