Un ampliamente utilizado conjunto de datos de inteligencia artificial utilizado para entrenar modelos generadores de imágenes de inteligencia artificial como Stable Diffusion, Imagen y otros, ha sido retirado por su creador después de que un estudio encontrara miles de instancias de presunto material de abuso sexual infantil.
LAION, también conocido como Large-scale Artificial Intelligence Open Network, es una organización sin fines de lucro alemana que crea modelos y conjuntos de datos de inteligencia artificial de código abierto utilizados para entrenar varios modelos populares de texto a imagen.

Un informe del 20 de diciembre de investigadores del Centro de Política Cibernética de la Observatorio de Internet de Stanford indicó que identificaron 3,226 instancias de presunto material de abuso sexual infantil en el conjunto de datos LAION-5B, "gran parte de la cual fue confirmada como material de abuso sexual infantil por terceros", según David Thiel, arquitecto de big data y tecnólogo jefe del Centro de Política Cibernética de Stanford.
Thiel señaló que si bien la presencia de material de abuso sexual infantil no necesariamente significa que influirá "drásticamente" en la producción de modelos entrenados en el conjunto de datos, aún podría tener algún efecto.
"Si bien la cantidad de material de abuso sexual infantil presente no indica necesariamente que la presencia de material de abuso sexual infantil influya drásticamente en la producción del modelo más allá de la capacidad del modelo para combinar los conceptos de actividad sexual e infancia, probablemente aún ejerza influencia", dijo Thiel.
El conjunto de datos LAION-5B fue lanzado en marzo de 2022 e incluye 5.85 mil millones de pares de imágenes y texto, según LAION.
LAION tiene una política de tolerancia cero para el contenido ilegal. Trabajamos con organizaciones como IWF y otras para validar enlaces en los conjuntos de datos de LAION con herramientas de filtrado desarrolladas por nuestra comunidad y organizaciones asociadas para asegurarnos de que sean seguros antes de republicarlos. https://t.co/SStsqukbFK
— LAION (@laion_ai) 20 de diciembre de 2023
LAION tiene una política de tolerancia cero para el contenido ilegal. Trabajamos con organizaciones como IWF y otras para validar enlaces en los conjuntos de datos de LAION con herramientas de filtrado desarrolladas por nuestra comunidad y organizaciones asociadas para asegurarnos de que sean seguros antes de republicarlos
En un comunicado, LAION dijo que ha retirado los conjuntos de datos "por precaución", incluyendo tanto LAION-5B como su LAION-400M, "para asegurarse de que sean seguros antes de republicarlos".
Aclaración: La información y/u opiniones emitidas en este artículo no representan necesariamente los puntos de vista o la línea editorial de Cointelegraph. La información aquí expuesta no debe ser tomada como consejo financiero o recomendación de inversión. Toda inversión y movimiento comercial implican riesgos y es responsabilidad de cada persona hacer su debida investigación antes de tomar una decisión de inversión