Un equipo de científicos en Bélgica podría haber resuelto uno de los mayores desafíos en el campo de la IA mediante un método de entrenamiento descentralizado basado en blockchain. Aunque la investigación aún se encuentra en sus primeras etapas, sus implicaciones potenciales podrían variar desde revolucionar la exploración espacial hasta plantear una amenaza existencial para la humanidad.
En un entorno simulado, los investigadores desarrollaron una manera de coordinar el aprendizaje entre agentes de IA autónomos individuales. El equipo utilizó la tecnología blockchain para facilitar y asegurar las comunicaciones de los agentes, creando así un “enjambre” descentralizado de modelos de aprendizaje.
Los resultados individuales de entrenamiento para cada agente en el enjambre se utilizaron luego para desarrollar un modelo de IA más grande. Dado que los datos se manejaron a través de blockchain, este sistema más grande se benefició de la inteligencia colectiva del enjambre sin acceder a los datos de los agentes individuales.
Enjambres de IA
El aprendizaje automático, un concepto estrechamente relacionado con la inteligencia artificial, se presenta en muchas formas. El chatbot típico, como ChatGPT de OpenAI o Claude de Anthropic, por ejemplo, se desarrolla utilizando múltiples técnicas. Primero se entrena mediante un paradigma llamado "aprendizaje no supervisado" y luego se ajusta con otro conocido como "aprendizaje por refuerzo a partir de retroalimentación humana."
Uno de los mayores desafíos con este enfoque es que, por lo general, requiere que los datos de entrenamiento del sistema estén centralizados en una base de datos. Esto lo hace poco práctico para aplicaciones que requieren aprendizaje autónomo continuo o donde la privacidad es importante.
El equipo de investigación llevó a cabo su estudio de blockchain utilizando un paradigma de aprendizaje denominado "aprendizaje federado descentralizado." Al hacerlo, descubrieron que podían coordinar con éxito los modelos mientras mantenían la descentralización de los datos.
Enjambre de seguridad
La mayor parte de la investigación del equipo se centró en estudiar la resiliencia del enjambre frente a varios métodos de ataque. Dado que la tecnología blockchain es un libro de contabilidad compartido y la red de entrenamiento utilizada en el experimento era a su vez descentralizada, el equipo pudo demostrar robustez contra ataques de hacking tradicionales.
Sin embargo, encontraron un umbral definido para el número exacto de robots maliciosos que el enjambre podría manejar. Los investigadores desarrollaron escenarios con robots diseñados intencionalmente para dañar la red. Estos incluían agentes con agendas nefastas, agentes con información desactualizada y robots programados con simples instrucciones de perturbación.
Mientras que los agentes simples y desactualizados fueron relativamente fáciles de defender, el equipo descubrió que los agentes inteligentes con agendas nefastas podrían eventualmente perturbar la inteligencia del enjambre si suficientes lograran infiltrarse.
Esta investigación sigue siendo experimental y solo se ha llevado a cabo a través de simulaciones. Pero podría llegar un momento en que los enjambres de robots puedan ser coordinados de manera descentralizada. Esto podría permitir que equipos de agentes de IA de diferentes empresas o países colaboren para entrenar un agente más grande sin sacrificar la privacidad de los datos.