Google ha lanzado dos versiones estables de los modelos de API Gemini 1.5 para desarrolladores, prometiendo un mayor rendimiento y menores costes de producción de aplicaciones.

El 24 de septiembre, Google anunció el lanzamiento de las versiones estables de Gemini 1.5 Pro (gemini-1.5-pro-002) y Gemini 1.5 Flash (gemini-1.5-flash-002). En comparación con los anteriores modelos 001, los nuevos modelos Gemini listos para producción han mostrado mejoras significativas en la generación de código, matemáticas, razonamiento y análisis de vídeo, entre otras.

Descripción de los modelos de Google Gemini 1.5 Flash y Pro. Fuente: Google AI for Developers

Gemini 1.5 Pro reduce las barreras financieras para los desarrolladores

Google ha reducido el precio de su modelo Gemini 1.5 Pro listo para producción en más de un 50%, al tiempo que afirma haber triplicado los límites de velocidad y haber reducido la latencia con respecto a las versiones anteriores del modelo experimental.

Fuente: Google DeepMind

Según las notas de publicación de Google, ambos modelos de Gemini 1.5 ofrecen mejoras significativas en factualidad y reducen las alucinaciones de los modelos, seguimiento de instrucciones, comprensión multilingüe en 102 idiomas, generación de SQL y comprensión de audio y documentos.

Comparación del rendimiento de las versiones nueva y antigua del modelo Gemini 1.5. Fuente: Google para desarrolladores

Google redujo las longitudes de resumen para ambos modelos y aconsejó a los desarrolladores de productos basados en chat tener opciones para aumentar las capacidades conversacionales de la API.

A partir del 1 de octubre, los precios de la API Gemini 1.5 Pro en prompts inferiores a 128,000 tokens se reducirán al 64% para tokens de entrada, al 52% para tokens de salida y al 64% para tokens incrementales en caché.

"Para que a los desarrolladores les resulte aún más fácil construir con Gemini, estamos aumentando los límites de las tarifas de los niveles de pago para 1.5 Flash a 2,000 RPM y para 1.5 Pro a 1,000 RPM, frente a 1,000 y 360, respectivamente", decía el anuncio.

Nuevos precios para Google Gemini 1.5 Pro. Fuente: Google para desarrolladores

Google lanza la versión experimental de Gemini 1.5 Flash 

Google también ha anunciado el lanzamiento de Gemini 1.5 Flash-8B, una versión experimental más pequeña de 1.5 Flash con cifras de referencia más bajas. Esta actualización incluye aumentos significativos del rendimiento en los casos de uso de texto y multimodal. 

Todas las versiones están disponibles actualmente en Google AI Studio y en la API de Gemini.

Por su parte, el mayor competidor de Google en inteligencia artificial, OpenAI, ha empezado a desplegar su función "Advanced Voice" para usuarios seleccionados de ChatGPT.

Fuente: OpenAI

El “Advanced Voice” Mode de ChatGPT permite una comunicación más rápida e intuitiva con la IA. Como parte de esta nueva función, OpenAI ha presentado cinco nuevas voces: Arbor, Maple, SXol, Spruce y Vale, que se suman a las ya existentes Breeze, Juniper, Cove y Ember.

Aclaración: La información y/u opiniones emitidas en este artículo no representan necesariamente los puntos de vista o la línea editorial de Cointelegraph. La información aquí expuesta no debe ser tomada como consejo financiero o recomendación de inversión. Toda inversión y movimiento comercial implican riesgos y es responsabilidad de cada persona hacer su debida investigación antes de tomar una decisión de inversión