Anthropic, una empresa de inteligencia artificial (IA) y "beneficio público", lanzó Claude 2 el 11 de julio, marcando otro hito en un año lleno de avances aparentemente incesantes del floreciente sector de la IA generativa. 

Según una entrada del blog de la empresa, Claude 2 muestra mejoras en casi todas las categorías medibles. Quizá lo más destacable de las diferencias con su predecesor es la forma en que los investigadores hablan de su trabajo.

En la publicación que anuncia Claude 2 no se hace mención alguna a la evaluación comparativa tradicional del aprendizaje automático ni a puntuaciones computacionales frente a modelos similares. En su lugar, Anthropic puso a prueba a Claude y Claude 2 en numerosas pruebas que representaban conocimientos, habilidades y resolución de problemas del mundo real.

Claude 2 superó a su predecesor en conocimientos, codificación y otros exámenes y, según Anthropic, incluso obtiene buenos resultados en comparación con la media humana:

"Cuando se compara con estudiantes universitarios que solicitan un posgrado, Claude 2 obtiene puntuaciones por encima del percentil 90 en los exámenes GRE de lectura y escritura, y similares a la media de los solicitantes en razonamiento cuantitativo".

Cabe señalar que muchos expertos creen que las comparaciones entre examinandos humanos y de IA son ineficaces debido a la naturaleza del razonamiento cognitivo humano y a la probabilidad de que el conjunto de datos de entrenamiento de un gran modelo lingüístico contenga información de pruebas. Esencialmente, las pruebas diseñadas para humanos pueden no "probar" realmente la capacidad de razonamiento de una IA o proporcionar una demostración adecuada de conocimientos o habilidades reales.

Junto con el lanzamiento de Claude 2, Anthropic estrenó una versión beta de la interfaz web "Talk to Claude" (Habla con Claude) que proporciona acceso general al chatbot a usuarios de EE.UU. y el Reino Unido.

Cointelegraph realizó una breve prueba de la nueva versión y, anecdóticamente hablando, las mejoras se notan de inmediato. Claude 2 respondió a nuestras preguntas casi al instante con respuestas claras y concisas.

Chat con Claude 2 a través de la web de Anthropic.

Según Anthropic, el límite del nuevo modelo es de 100,000 tokens, es decir, el equivalente a 75,000 palabras. La interfaz de usuario del sitio indica que los usuarios pueden cargar documentos PDF, TXT, CSV y similares para su análisis, aunque esta funcionalidad no funcionó en las pruebas limitadas que realizamos antes de publicar este artículo.

Aclaración: La información y/u opiniones emitidas en este artículo no representan necesariamente los puntos de vista o la línea editorial de Cointelegraph. La información aquí expuesta no debe ser tomada como consejo financiero o recomendación de inversión. Toda inversión y movimiento comercial implican riesgos y es responsabilidad de cada persona hacer su debida investigación antes de tomar una decisión de inversión.

Sigue leyendo: