Un equipo de investigadores del Noah's Ark Lab de Huawei en París publicó recientemente una investigación preliminar que describe un posible marco para la "inteligencia artificial incorporada" (E-AI), algo que afirman servirá como el "próximo paso fundamental en la búsqueda de la inteligencia artificial general (AGI)".

AGI, a veces llamada "IA a nivel humano" o "IA fuerte", se refiere típicamente a un sistema de inteligencia artificial (IA) capaz de realizar cualquier tarea dadas los recursos necesarios. Aunque no hay un consenso científico claro sobre lo que calificaría a un sistema de IA específico para su consideración como una inteligencia general, empresas como OpenAI se han fundado únicamente con el propósito de perseguir esta tecnología.

Modelos de lenguaje grandes

Con la llegada de la tecnología de transformers preentrenados generativos (GPT) a finales de la década de 2010, muchos expertos que trabajan en inteligencia artificial general (AGI) adoptaron la máxima de que "la escala es todo lo que necesitas" - lo que significa que creían que los transformers, a escalas más allá de lo que era posible en ese momento, eventualmente llevarían a un modelo AGI.

Pero el documento del equipo de Huawei esencialmente argumenta que los modelos de lenguaje grandes, como ChatGPT de OpenAI y Gemini de Google, no pueden entender el mundo real porque no viven en él.

Según el documento:

“Es una creencia generalizada que simplemente escalar dichos modelos, en términos de volumen de datos y potencia computacional, podría llevar a AGI. Nosotros cuestionamos esta visión. Proponemos que la verdadera comprensión ... solo se puede lograr a través de agentes de E-AI que viven en el mundo y aprenden de él interactuando con él”.

Inteligencia artificial incorporada

Para que los agentes de IA interactúen verdaderamente con el mundo real, afirman los investigadores, los modelos deberán estar alojados en alguna forma de incorporación capaz de percepción, acción, memoria y aprendizaje.

La percepción, en este contexto, implica dar al sistema de IA la capacidad de obtener datos sin procesar del mundo real, en tiempo real, y la capacidad de procesar y codificar esos datos en un espacio de aprendizaje latente. Básicamente, la IA deberá ser capaz de prestar atención a lo que desea, con sus propios "ojos" y "oídos", para entender lo suficiente del mundo real como para actuar como una inteligencia general.

Junto con la percepción, los agentes deben ser capaces de tomar acciones y observar sus resultados. Los modelos de IA actuales son "preentrenados", como un estudiante que recibe una prueba y sus respuestas al mismo tiempo. Al permitir que la IA actúe por sí misma y perciba los resultados de sus acciones como nuevos recuerdos, el equipo cree que los agentes podrían ser capaces de aprender sobre el mundo de la misma manera que lo hacen los seres vivos, a través de ensayo y error.

En última instancia, los investigadores demuestran un marco teórico mediante el cual un LLM o modelo de IA fundamental podría incorporarse para lograr estos objetivos algún día.

Sin embargo, los investigadores también señalan que hay numerosos desafíos que se interponen en el camino. No menos importante es que los LLM más potentes actualmente "existen" en enormes redes en la nube, lo que hace que la incorporación sea una proposición difícil con la tecnología actual.

Aclaración: La información y/u opiniones emitidas en este artículo no representan necesariamente los puntos de vista o la línea editorial de Cointelegraph. La información aquí expuesta no debe ser tomada como consejo financiero o recomendación de inversión. Toda inversión y movimiento comercial implican riesgos y es responsabilidad de cada persona hacer su debida investigación antes de tomar una decisión de inversión.