Anthropic, una empresa de inteligencia artificial (IA) y "beneficio público", lanzó Claude 2 el 11 de julio, marcando otro hito en un año lleno de avances aparentemente incesantes del floreciente sector de la IA generativa.
Introducing Claude 2! Our latest model has improved performance in coding, math and reasoning. It can produce longer responses, and is available in a new public-facing beta website at https://t.co/uLbS2JNczH in the US and UK. pic.twitter.com/jSkvbXnqLd
— Anthropic (@AnthropicAI) July 11, 2023
Según una entrada del blog de la empresa, Claude 2 muestra mejoras en casi todas las categorías medibles. Quizá lo más destacable de las diferencias con su predecesor es la forma en que los investigadores hablan de su trabajo.
En la publicación que anuncia Claude 2 no se hace mención alguna a la evaluación comparativa tradicional del aprendizaje automático ni a puntuaciones computacionales frente a modelos similares. En su lugar, Anthropic puso a prueba a Claude y Claude 2 en numerosas pruebas que representaban conocimientos, habilidades y resolución de problemas del mundo real.
Claude 2 superó a su predecesor en conocimientos, codificación y otros exámenes y, según Anthropic, incluso obtiene buenos resultados en comparación con la media humana:
"Cuando se compara con estudiantes universitarios que solicitan un posgrado, Claude 2 obtiene puntuaciones por encima del percentil 90 en los exámenes GRE de lectura y escritura, y similares a la media de los solicitantes en razonamiento cuantitativo".
Cabe señalar que muchos expertos creen que las comparaciones entre examinandos humanos y de IA son ineficaces debido a la naturaleza del razonamiento cognitivo humano y a la probabilidad de que el conjunto de datos de entrenamiento de un gran modelo lingüístico contenga información de pruebas. Esencialmente, las pruebas diseñadas para humanos pueden no "probar" realmente la capacidad de razonamiento de una IA o proporcionar una demostración adecuada de conocimientos o habilidades reales.
Junto con el lanzamiento de Claude 2, Anthropic estrenó una versión beta de la interfaz web "Talk to Claude" (Habla con Claude) que proporciona acceso general al chatbot a usuarios de EE.UU. y el Reino Unido.
Cointelegraph realizó una breve prueba de la nueva versión y, anecdóticamente hablando, las mejoras se notan de inmediato. Claude 2 respondió a nuestras preguntas casi al instante con respuestas claras y concisas.

Según Anthropic, el límite del nuevo modelo es de 100,000 tokens, es decir, el equivalente a 75,000 palabras. La interfaz de usuario del sitio indica que los usuarios pueden cargar documentos PDF, TXT, CSV y similares para su análisis, aunque esta funcionalidad no funcionó en las pruebas limitadas que realizamos antes de publicar este artículo.
Aclaración: La información y/u opiniones emitidas en este artículo no representan necesariamente los puntos de vista o la línea editorial de Cointelegraph. La información aquí expuesta no debe ser tomada como consejo financiero o recomendación de inversión. Toda inversión y movimiento comercial implican riesgos y es responsabilidad de cada persona hacer su debida investigación antes de tomar una decisión de inversión.
Sigue leyendo:
- Sarah Silverman demanda a Meta y OpenAI por infringir derechos de autor
- Senadores de EEUU recibirán información clasificada sobre inteligencia artificial en la Casa Blanca
- 5 empleos básicos relacionados con el aprendizaje automático
- Lightning Labs lanza herramientas que permiten a la IA realizar transacciones y hacer holding de bitcoin
- Expertos en IA firman un documento que compara el riesgo de "extinción por IA" con pandemias y guerras nucleares
- Demis Hassabis, CEO de Google DeepMind, afirma que podríamos ver la llegada de la inteligencia artificial general "en los próximos años"
- El portal de reclamos de FTX deja de estar disponible al poco tiempo de ser puesto en línea