Anthropic lanza Claude 2 en medio de la algarabía por la IA

11 jul 2023

El nuevo modelo demuestra mejoras apreciables en numerosas categorías, como los tiempos de respuesta casi instantáneos y la capacidad de analizar entradas de hasta 100,000 tokens.

Anthropic lanza Claude 2 en medio de la algarabía por la IA — Noticias

Anthropic, una empresa de inteligencia artificial (IA) y "beneficio público", lanzó Claude 2 el 11 de julio, marcando otro hito en un año lleno de avances aparentemente incesantes del floreciente sector de la IA generativa.

Introducing Claude 2! Our latest model has improved performance in coding, math and reasoning. It can produce longer responses, and is available in a new public-facing beta website at https://t.co/uLbS2JNczH in the US and UK. pic.twitter.com/jSkvbXnqLd
— Anthropic (@AnthropicAI) July 11, 2023

Según una entrada del blog de la empresa, Claude 2 muestra mejoras en casi todas las categorías medibles. Quizá lo más destacable de las diferencias con su predecesor es la forma en que los investigadores hablan de su trabajo.

Sarah Silverman demanda a Meta y OpenAI por infringir derechos de autor

En la publicación que anuncia Claude 2 no se hace mención alguna a la evaluación comparativa tradicional del aprendizaje automático ni a puntuaciones computacionales frente a modelos similares. En su lugar, Anthropic puso a prueba a Claude y Claude 2 en numerosas pruebas que representaban conocimientos, habilidades y resolución de problemas del mundo real.

Claude 2 superó a su predecesor en conocimientos, codificación y otros exámenes y, según Anthropic, incluso obtiene buenos resultados en comparación con la media humana:

"Cuando se compara con estudiantes universitarios que solicitan un posgrado, Claude 2 obtiene puntuaciones por encima del percentil 90 en los exámenes GRE de lectura y escritura, y similares a la media de los solicitantes en razonamiento cuantitativo".

Cabe señalar que muchos expertos creen que las comparaciones entre examinandos humanos y de IA son ineficaces debido a la naturaleza del razonamiento cognitivo humano y a la probabilidad de que el conjunto de datos de entrenamiento de un gran modelo lingüístico contenga información de pruebas. Esencialmente, las pruebas diseñadas para humanos pueden no "probar" realmente la capacidad de razonamiento de una IA o proporcionar una demostración adecuada de conocimientos o habilidades reales.

Senadores de EEUU recibirán información clasificada sobre inteligencia artificial en la Casa Blanca

Junto con el lanzamiento de Claude 2, Anthropic estrenó una versión beta de la interfaz web "Talk to Claude" (Habla con Claude) que proporciona acceso general al chatbot a usuarios de EE.UU. y el Reino Unido.

Cointelegraph realizó una breve prueba de la nueva versión y, anecdóticamente hablando, las mejoras se notan de inmediato. Claude 2 respondió a nuestras preguntas casi al instante con respuestas claras y concisas.

*Chat con Claude 2 a través de la web de Anthropic.*

Según Anthropic, el límite del nuevo modelo es de 100,000 tokens, es decir, el equivalente a 75,000 palabras. La interfaz de usuario del sitio indica que los usuarios pueden cargar documentos PDF, TXT, CSV y similares para su análisis, aunque esta funcionalidad no funcionó en las pruebas limitadas que realizamos antes de publicar este artículo.

Aclaración: La información y/u opiniones emitidas en este artículo no representan necesariamente los puntos de vista o la línea editorial de Cointelegraph. La información aquí expuesta no debe ser tomada como consejo financiero o recomendación de inversión. Toda inversión y movimiento comercial implican riesgos y es responsabilidad de cada persona hacer su debida investigación antes de tomar una decisión de inversión.

Sigue leyendo:

Cointelegraph está comprometido con un periodismo independiente y transparente. Este artículo de noticias se elabora de conformidad con la Política Editorial de Cointelegraph y tiene como objetivo proporcionar información precisa y oportuna. Se recomienda a los lectores verificar la información de manera independiente. Lea nuestra Política Editorial https://es.cointelegraph.com/editorial-policy