El cofundador de Ethereum, Vitalik Buterin, ha respaldado el nuevo método de compresión Token for Image Tokenizer (TiTok) por su potencial aplicación en blockchain.

No debe confundirse con la plataforma de redes sociales TikTok; el nuevo método de compresión TiTok reduce significativamente el tamaño de la imagen, haciéndolo más práctico para el almacenamiento en blockchain.

Buterin destacó el potencial de TiTok en blockchain en la plataforma de redes sociales descentralizada Farcaster, afirmando que “320 bits es básicamente un hash. Lo suficientemente pequeño como para ir en cadena para cada usuario.”

El desarrollo podría tener importantes implicaciones para el almacenamiento digital de imágenes de fotos de perfil (PFP) y tokens no fungibles (NFTs).

Fuente: Thomas

Compresión de imágenes TiTok

Desarrollado por ByteDance y la Universidad Técnica de Múnich, TiTok permite la compresión de una imagen en 32 pequeñas piezas de datos (bits) sin perder calidad.

Según el documento de investigación de TiTok, la avanzada compresión de imágenes mediante inteligencia artificial (IA) permite a TiTok comprimir una imagen de 256x256 píxeles en “32 tokens discretos”.

TiTok es un marco de tokenización de imágenes unidimensional (1D) que “rompe las limitaciones de cuadrícula existentes en los métodos de tokenización 2D,” lo que lleva a imágenes más flexibles y compactas.

“Como resultado, se acelera sustancialmente el proceso de muestreo (por ejemplo, 410 veces más rápido que DiT-XL/2) mientras se obtiene una calidad de generación competitiva.”
Documento de investigación de TiTok mostrando comparaciones de tamaños de compresión de imágenes.

Imágenes mediante aprendizaje automático

TiTok utiliza aprendizaje automático y avanzada IA, empleando modelos basados en transformadores para convertir imágenes en representaciones tokenizadas.

El método utiliza la redundancia de región, es decir, identifica y utiliza información redundante en diferentes regiones de la imagen para reducir el tamaño total de los datos del producto final.

“Los avances recientes en modelos generativos han destacado el papel crucial de la tokenización de imágenes en la síntesis eficiente de imágenes de alta resolución.”

Según el documento de investigación, la "representación latente compacta” de TiTok puede proporcionar “representaciones sustancialmente más eficientes y efectivas que las técnicas convencionales.”

Ilustración de la reconstrucción de imágenes (a) y generación (b) con el marco TiTok (c).

TiTok, no TikTok

A pesar del nombre similar, TikTok, la plataforma de redes sociales, no recibió respaldo de Buterin.

El cofundador de Ethereum, al destacar el potencial de TiTok en blockchain, da credibilidad al nuevo método de compresión de imágenes impulsado por IA.

“A diferencia de los modelos VQ 2D existentes que consideran el espacio latente de la imagen como una cuadrícula 2D, proporcionamos una formulación más compacta para tokenizar una imagen en una secuencia latente 1D.”

El nuevo método propuesto puede “representar una imagen con 8 a 64 veces” menos tokens que los “tokenizadores 2D,” y el equipo espera que la investigación pueda arrojar luz sobre “una representación de imagen más eficiente.”

Aclaración: La información y/u opiniones emitidas en este artículo no representan necesariamente los puntos de vista o la línea editorial de Cointelegraph. La información aquí expuesta no debe ser tomada como consejo financiero o recomendación de inversión. Toda inversión y movimiento comercial implican riesgos y es responsabilidad de cada persona hacer su debida investigación antes de tomar una decisión de inversión