OpenAI lanza GPT-5.4 Mini y Nano: velocidad duplicada, diseñados especialmente para la era de subagendes de IA, desde solo $0.2 por millón de tokens

動區BlockTempo

OpenAI ha lanzado oficialmente hoy (18) dos nuevos modelos ligeros: GPT-5.4 Mini y GPT-5.4 Nano. El primero ofrece una velocidad el doble de rápida que la generación anterior y tiene un precio de solo $0.75 por cada millón de tokens de entrada, mientras que el segundo, con una latencia ultrabaja y un precio muy competitivo de $0.20, apunta a conquistar el mercado de alto rendimiento y gran volumen de procesamiento.
(Resumen previo: OpenAI lanza GPT-5.2! Con el objetivo de reemplazar a profesionales, menor alucinación, organización de costos de API)
(Información adicional: Resumen completo de la conferencia de lanzamiento de GPT-5, el modelo más potente de OpenAI: acceso gratuito, funciones destacadas, precios de API de gpt-5, gpt-5-mini y gpt-5-nano)

Índice del artículo

Alternar

  • GPT-5.4 Mini: 2 veces más rápido, un peso ligero y versátil
  • GPT-5.4 Nano: latencia ultrabaja, diseñado para escenarios de alto rendimiento
  • Arquitectura de subagentes: los modelos pequeños no son versiones reducidas, sino parte del diseño del sistema

OpenAI lanzó hoy (18) a medianoche, simultáneamente, dos modelos de lenguaje pequeños: GPT-5.4 Mini y GPT-5.4 Nano. Estos modelos no son modelos insignia, sino que están diseñados específicamente como la capa de ejecución en un sistema de IA híbrido: modelos más potentes coordinan la planificación, mientras que numerosos modelos pequeños realizan en paralelo las tareas diarias de cálculo.

OpenAI denomina a esta arquitectura como “una mejora significativa en velocidad y eficiencia de costos mediante la adopción de precisión parcial”, y esta elección refleja la tendencia actual en la industria de IA, que pasa de un solo gran modelo a una “colaboración de múltiples agentes”.

GPT-5.4 Mini: 2 veces más rápido, un peso ligero y versátil

GPT-5.4 Mini es el producto principal de este lanzamiento, enfocado en equilibrar velocidad y capacidad multitarea. En comparación con la generación anterior, su velocidad de inferencia se ha duplicado, y en capacidades clave como generación de código, comprensión multimodal y llamadas a herramientas, ha recibido mejoras integrales.

En pruebas de referencia, GPT-5.4 Mini alcanzó un 54.4% en SWE-Bench Pro (reparación automática de problemas en GitHub) y un 72.1% en OSWorld-Verified (automatización de tareas en escritorio), cifras que representan el liderazgo actual en modelos de su nivel.

En cuanto a funciones, soporta entrada combinada de texto e imágenes, llamadas a herramientas, búsquedas en internet y archivos, así como interacción con interfaces de usuario en ordenadores, cubriendo casi toda la cadena de necesidades en aplicaciones modernas de IA. Los principales escenarios de uso listados por OpenAI incluyen: asistentes de código, integración en IDE, revisión de código, interpretación de capturas de pantalla, subagentes para uso en ordenadores y sistemas interactivos que requieren respuestas en tiempo real.

En cuanto a precios, GPT-5.4 Mini tiene un costo de $0.75 por cada millón de tokens de entrada y $4.50 por cada millón de tokens de salida, continuando con la estrategia reciente de OpenAI de reducir costos de forma activa.

En disponibilidad, GPT-5.4 Mini está abierto desde hoy en ChatGPT (en niveles gratuito y de suscripción Go), Codex y API de OpenAI, además de poder desplegarse a través de Azure AI Foundry.

GPT-5.4 Nano: latencia ultrabaja, diseñado para escenarios de alto rendimiento

GPT-5.4 Nano tiene una posición más definida: OpenAI lo denomina “el modelo más pequeño y más rentable hasta la fecha”, especialmente diseñado para escenarios donde la latencia es extremadamente sensible y se requiere procesamiento paralelo a gran escala.

En pruebas de referencia, Nano obtuvo un 52.4% en SWE-Bench Pro y un 39.0% en OSWorld, ligeramente por debajo de Mini, pero considerando su precio ultrabajo, su relación calidad-precio es muy destacada.

En funciones, Nano soporta seguimiento de instrucciones, llamadas a funciones, código básico, comprensión de imágenes, clasificación y extracción de datos, pudiendo afrontar la mayoría de tareas estructuradas, aunque no soporta operaciones complejas en escritorio ni tareas de razonamiento profundo.

En precios, Nano cuesta solo $0.20 por cada millón de tokens de entrada y $1.25 por cada millón de tokens de salida, aproximadamente una cuarta parte del precio de Mini, siendo ideal para empresas que requieren muchas llamadas automáticas. Los escenarios listados por la compañía incluyen: clasificación y extracción de datos, soporte para subagentes de código, automatización a gran escala, enrutamiento de solicitudes, procesamiento de formularios y flujos de trabajo de atención al cliente.

Es importante destacar que GPT-5.4 Nano actualmente solo está disponible vía API y no aparecerá en la interfaz de usuario de ChatGPT, siendo claramente un producto dirigido a desarrolladores y empresas.

Arquitectura de subagentes: los modelos pequeños no son versiones reducidas, sino parte del diseño del sistema

La promoción de OpenAI para estos modelos es “nacidos para la era de los subagentes”, una frase que tiene una lógica de producto concreta.

En sistemas de IA con múltiples agentes, los modelos insignia (como GPT-5 o los modelos de inferencia de la serie o) se encargan de la planificación de alto nivel y decisiones complejas, mientras que tareas repetitivas y estructuradas: extracción web, transformación de datos, llenado de formularios, generación de fragmentos de código, pueden ser manejadas en paralelo por modelos más pequeños, más rápidos y más económicos. GPT-5.4 Mini y Nano están diseñados precisamente para desempeñar ese rol en la capa de ejecución.

Esta lógica también explica por qué ambos modelos enfatizan las capacidades de llamadas a herramientas y control de ordenadores: en arquitecturas de IA cada vez más automatizadas, los modelos pequeños que pueden ejecutar instrucciones de forma estable y interactuar con sistemas externos tienen un valor comercial que no es menor que el de los modelos insignia con más parámetros.

Ver originales
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.
Comentar
0/400
Sin comentarios