Pantera Capital y las unidades de activos digitales de Franklin Templeton se han unido a la primera cohorte de Arena, un nuevo entorno de pruebas del laboratorio de IA de código abierto Sentient, diseñado para evaluar cómo se desempeñan los agentes de IA en flujos de trabajo de estilo empresarial.
En un anuncio del viernes compartido con Cointelegraph, Sentient posicionó Arena como una plataforma de evaluación comparativa de estilo de producción, en lugar de una prueba de modelo estática. En lugar de calificar a los agentes únicamente con conjuntos de datos fijos, los ejecuta a través de tareas estandarizadas modeladas en condiciones empresariales, incluyendo documentos extensos, información incompleta y fuentes contradictorias.
“En esta fase inicial, la participación se refiere a apoyar el programa Arena y la cohorte de desarrolladores”, dijo a Cointelegraph Oleg Golev, jefe de producto de Sentient Labs.
Explicó que los socios están ayudando a definir cómo se ve el “razonamiento listo para producción” para tareas intensivas en documentos como el análisis, la conformidad y las operaciones. Las empresas no están anunciando compromisos de capital vinculados a la iniciativa.
El lanzamiento se produce mientras las empresas aceleran el despliegue de agentes de IA en flujos de trabajo de investigación y operativos, incluso a medida que los marcos de gobernanza se quedan atrás.
Según el Informe de Optimización de Procesos de Celonis 2026, publicado el 4 de febrero, el 85% de los altos líderes empresariales encuestados aspira a convertirse en “empresas agénticas” en un plazo de tres años, mientras que solo el 19% utiliza actualmente sistemas multiagente.

Evaluación de estilo de producción, no puntuación estática
Golev describió Arena como una plataforma compartida donde los desarrolladores envían agentes de IA para tareas estandarizadas y comparan los resultados bajo condiciones de prueba consistentes.
La plataforma rastrea categorías de fallos como la alucinación, la evidencia faltante, las citas incorrectas y las lagunas en el razonamiento, lo que permite a los desarrolladores diagnosticar problemas recurrentes.
Arena planea publicar métricas de rendimiento comparativo a través de una clasificación pública y lanzar análisis post-mortem que resuman los modos de fallo comunes y sus soluciones.
Los socios de infraestructura, incluyendo OpenRouter y Fireworks, están suministrando el cálculo de inferencia para la cohorte inicial, mientras que otros socios apoyan con herramientas y talleres.
Capa de gobernanza en medio de la creciente autonomía de la IA
La iniciativa surge a medida que las empresas financieras y de criptomonedas experimentan con la concesión de mayor autonomía económica a los sistemas de IA.
El miércoles, MoonPay lanzó infraestructura que permite a los agentes de IA crear wallets y ejecutar transacciones con stablecoins.
El jueves, ejecutivos de Stripe advirtieron que las blockchains podrían necesitar mejoras significativas de escalabilidad si el comercio impulsado por IA se expande.
Aclaración: La información y/u opiniones emitidas en este artículo no representan necesariamente los puntos de vista o la línea editorial de Cointelegraph. La información aquí expuesta no debe ser tomada como consejo financiero o recomendación de inversión. Toda inversión y movimiento comercial implican riesgos y es responsabilidad de cada persona hacer su debida investigación antes de tomar una decisión de inversión.

