OpenAI Lança GPT-5.4 Mini e Nano, Que Poderiam Ser Mais Úteis Do Que o Grande Modelo

Decrypt

Resumo

  • A OpenAI lançou o GPT-5.4 Mini e Nano, dois modelos mais rápidos e mais baratos, projetados para cargas de trabalho de IA de alto volume.
  • Os modelos trocam um pouco de precisão por velocidade e custo, direcionados a tarefas repetitivas e fáceis, como suporte ao cliente e fluxos de trabalho automatizados.
  • Os desenvolvedores podem agora executar sistemas híbridos de IA, onde um modelo principal planeja tarefas enquanto modelos menores lidam com a maior parte do trabalho.

A OpenAI não está desacelerando. Menos de duas semanas após o lançamento do GPT-5.4 — lançado apenas dois dias após o GPT-5.3 — a empresa lançou na terça-feira mais dois modelos: GPT-5.4 Mini e GPT-5.4 Nano. Estes não são versões simplificadas do modelo principal — são máquinas feitas sob medida para trabalhos onde esperar meia minuto por uma resposta não é uma opção. A OpenAI os chama de seus “modelos pequenos mais capazes até agora”, dizendo que o GPT-5.4 Mini é mais de duas vezes mais rápido que o GPT-5 Mini. Se já assistiu a um assistente de codificação pensar por 45 segundos antes de editar três linhas de código, então entende o apelo de um modelo rápido.

Estamos apresentando o GPT-5.4 mini e nano, nossos modelos pequenos mais capazes até agora.

O GPT-5.4 mini é mais de 2x mais rápido que o GPT-5 mini. Otimizado para codificação, uso de computador, compreensão multimodal e subagentes.

Para tarefas mais leves, o GPT-5.4 nano é o nosso menor e mais barato… pic.twitter.com/cdp5HWtM2M

— OpenAI Developers (@OpenAIDevs) 17 de março de 2026

Por que alguém lançaria um modelo menos preciso de propósito? A resposta curta: porque a precisão nem sempre é o gargalo. Se você estiver rodando um chatbot de suporte ao cliente que responde às mesmas 200 perguntas o dia todo, não precisa do modelo que obteve a melhor pontuação em exames de química de PhD. Você precisa daquele que responde em menos de um segundo e custa uma fração de um centavo por resposta. É para esse espaço que esses modelos foram feitos. Mas isso não significa que esses modelos sejam burros ou pouco confiáveis. Em testes de benchmarks de codificação, o GPT-5.4 Mini obteve 54,4% no SWE-Bench Pro — um teste que mede a capacidade do modelo de resolver problemas reais do GitHub — em comparação com 45,7% do antigo GPT-5 Mini e 57,7% do GPT-5.4 completo. No OSWorld-Verified, que avalia o quão bem um modelo consegue operar um computador de mesa lendo capturas de tela, o Mini atingiu 72,1%, quase igual ao modelo principal com 75,0% — ambos superando a linha de base humana de 72,4%. O GPT-5.4 Nano, por sua vez, pontua 52,4% no SWE-Bench Pro e 39,0% no OSWorld — menor que o Mini, mas ainda um grande avanço sobre modelos Nano anteriores.

“O GPT-5.4 representa um avanço tanto para os modelos Mini quanto para os Nano em nossas avaliações internas,” disse o CTO adjunto da Perplexity, Jerry Ma, após testar ambos. “O Mini oferece raciocínio forte, enquanto o Nano é responsivo e eficiente para fluxos de trabalho de conversação ao vivo.” Em vez de direcionar todas as tarefas através de um modelo principal caro, agora você pode construir sistemas onde o grande modelo planeja e coordena, enquanto modelos menores lidam com o trabalho real em paralelo — procurando em uma base de código aqui, lendo um documento ali ou processando um formulário em outro lugar. Como vimos na nossa comparação GPT-5.4 vs. Grok 4.20, a posição do modelo no fluxo de trabalho importa tanto quanto qual modelo você escolhe.  O GPT-5.4 Mini funciona a uma taxa de $0,75 por milhão de tokens de entrada e $4,50 por milhão de tokens de saída via API. O GPT-5.4 Nano é ainda mais barato: $0,20 por milhão de tokens de entrada e $1,25 por milhão de tokens de saída — um preço que torna financeiramente viável para startups realizar um grande volume de consultas por dia. Para contextualizar, o Nano é aproximadamente quatro vezes mais barato que o Mini em entradas. Para usuários regulares do ChatGPT, o GPT-5.4 Mini já está disponível hoje para usuários Free e Go através da opção “Pensando” no menu plus. Assinantes pagos que atingirem seus limites de taxa do GPT-5.4 serão automaticamente redirecionados para o Mini. O GPT-5.4 Nano, por enquanto, é apenas via API — a OpenAI claramente o posiciona como uma ferramenta para desenvolvedores, não para consumidores.

Ver original
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
Nenhum comentário