Un equipo de científicos de la Universidad de Ciencia y Tecnología de China y el laboratorio YouTu de Tencent ha desarrollado una herramienta para combatir la "alucinación" en modelos de inteligencia artificial (IA).
La alucinación es la tendencia de un modelo de IA a generar salidas con un alto nivel de confianza que no parecen basarse en la información presente en sus datos de entrenamiento. Este problema permea la investigación en modelos de lenguaje de gran escala (LLM). Sus efectos se pueden observar en modelos como ChatGPT de OpenAI y Claude de Anthropic.
El equipo de USTC/Tencent ha desarrollado una herramienta llamada "Woodpecker" que afirman es capaz de corregir alucinaciones en modelos de lenguaje de gran escala multimodales (MLLM).
Este subconjunto de IA involucra modelos como GPT-4 (especialmente su variante visual, GPT-4V) y otros sistemas que integran la visión y/u otros procesamientos en la modalidad de inteligencia artificial generativa junto con la modelización del lenguaje basada en texto.
Según el artículo de investigación preliminar del equipo, Woodpecker utiliza tres modelos de IA separados, aparte del MLLM que se corrige por las alucinaciones, para realizar la corrección de las alucinaciones.
Estos incluyen GPT-3.5 turbo, Grounding DINO y BLIP-2-FlanT5. Juntos, estos modelos funcionan como evaluadores para identificar alucinaciones e instruir al modelo que se está corrigiendo para regenerar su salida de acuerdo con sus datos.

Para corregir las alucinaciones, los modelos de IA que alimentan "Woodpecker" utilizan un proceso de cinco etapas que implica "extracción de conceptos clave, formulación de preguntas, validación de conocimientos visuales, generación de afirmaciones visuales y corrección de alucinaciones".
Los investigadores afirman que estas técnicas proporcionan una mayor transparencia y "una mejora del 30.66%/24.33% en precisión sobre MiniGPT-4/mPLUG-Owl de referencia". Evaluaron numerosos MLLMs "listos para usar" utilizando su método y concluyeron que Woodpecker podría ser "fácilmente integrado en otros MLLMs".
Una versión de prueba de Woodpecker está disponible en Gradio Live, donde cualquier persona interesada puede ver la herramienta en acción.
Aclaración: La información y/u opiniones emitidas en este artículo no representan necesariamente los puntos de vista o la línea editorial de Cointelegraph. La información aquí expuesta no debe ser tomada como consejo financiero o recomendación de inversión. Toda inversión y movimiento comercial implican riesgos y es responsabilidad de cada persona hacer su debida investigación antes de tomar una decisión de inversión.