El futuro de la inteligencia artificial podría implicar más una toma de control corporativa que una rebelión de robots. Esto, según Dario Amodei, CEO de la empresa de IA Anthropic.
Amodei discutió recientemente el futuro de la IA en una entrevista con Noah Smith y Erik Torenberg en el podcast Econ 102. El trío abordó temas que van desde el uso militar de la IA hasta el reemplazo de trabajadores humanos por máquinas más eficientes.
Sin embargo, lo más interesante fue cuando Amodei habló sobre los esfuerzos internos de la empresa para desarrollar una estructura jerárquica eficiente para completar tareas a través de una red de modelos de inteligencia artificial.
Redes dentro de redes
La IA con la que la mayoría de las personas están familiarizadas hoy en día viene en forma de chatbots y generadores de imágenes. ChatGPT de OpenAI y Claude de Anthropic son sistemas de IA de última generación que, de manera independiente, han costado decenas de miles de millones de dólares para desarrollarse.
Pero la mayoría de las aplicaciones útiles para la tecnología que sustenta estos sistemas no requieren todas sus capacidades. Si, por ejemplo, estás usando Claude para ayudar a generar código en Python para una aplicación Web3, probablemente no estás aprovechando la capacidad del modelo para generar poesía en francés.
Como lo describió Amodei en la entrevista, el pensamiento actual de la empresa parece involucrar la idea de enjambres de IA capaces de interconectarse para completar tareas específicas.
La premisa básica involucraría "grandes modelos que orquestan pequeños modelos". Amodei agregó que los modelos más grandes crearían hasta cientos de modelos más pequeños, rápidos y eficientes para realizar tareas.
Si bien Amodei utilizó la analogía de abejas obreras apoyando a su reina, lo que describió suena mucho a una infraestructura corporativa típica.
En la cima estaría el modelo central Claude, el sistema más poderoso de Anthropic. Y debajo de este habría varios modelos costosos y fundamentales entrenados en dominios de amplia área como matemáticas, programación y análisis de sentimientos. Debajo de esas máquinas de nivel ejecutivo habría una larga lista de modelos especializados dedicados a completar tareas específicas. Y, finalmente, bajo los especialistas de nivel medio, encontraríamos los modelos de nivel inicial, diseñados para uso a corto plazo.
El beneficio de este diseño podría significar potencialmente que los usuarios finales en todos los niveles tendrían acceso a las capacidades específicas que necesitan a través de una interfaz de usuario simple y única.
Aclaración: La información y/u opiniones emitidas en este artículo no representan necesariamente los puntos de vista o la línea editorial de Cointelegraph. La información aquí expuesta no debe ser tomada como consejo financiero o recomendación de inversión. Toda inversión y movimiento comercial implican riesgos y es responsabilidad de cada persona hacer su debida investigación antes de tomar una decisión de inversión.