2023 © Copyright 404 - Todos os direitos reservados

OpenAI lança GPT-5.4 mini e nano para cortar custo e ganhar velocidade

Novos modelos de IA foram criados para desenvolvedores que buscam respostas mais rápidas e custos operacionais reduzidos em aplicações.
Imagem: OpenAI/Reprodução

A OpenAI lançou duas versões compactas de seu modelo de inteligência artificial GPT-5.4 nesta quarta-feira (18). Os novos modelos, chamados GPT-5.4 mini e GPT-5.4 nano, foram criados para desenvolvedores que buscam respostas mais rápidas e custos operacionais menores.

O GPT-5.4 mini funciona com velocidade superior ao dobro da versão anterior. O desempenho se mantém próximo ao modelo completo em testes principais. De acordo com o Digital Trends, o GPT-5.4 nano foi desenvolvido para tarefas simples como classificação e extração de dados, representando assim uma alternativa ainda mais econômica para operações básicas.

A estratégia da empresa atende aplicações que dependem de feedback rápido. Assistentes de programação, agentes em segundo plano e ferramentas de visão em tempo real precisam de respostas imediatas. Nesses casos, um modelo menor pode entregar resultado geral superior.

Desempenho e custos dos novos modelos

O GPT-5.4 mini alcança 54,4% no SWE-Bench Pro. O modelo completo atinge 57,7% no mesmo teste. No OSWorld-Verified, o mini chega a 72,1%. A versão maior registra 75%.

Além disso, os preços caem de forma significativa. O GPT-5.4 mini custa US$ 0,75 por milhão de tokens de entrada. Por outro lado, o valor sobe para US$ 4,50 por milhão de tokens de saída. Já o nano tem preço de US$ 0,20 e US$ 1,25, respectivamente.

Os dois modelos suportam entradas de texto e imagem. Além disso, também oferecem uso de ferramentas, chamada de funções e janela de contexto de 400 mil tokens. O preço mais baixo não elimina capacidades centrais.

No Codex, o modelo mini usa apenas 30% da cota do GPT-5.4. Desenvolvedores podem transferir trabalho de codificação de rotina para um nível mais barato. Dessa forma, o modelo completo fica reservado para raciocínio mais complexo.

Disponibilidade e aplicações práticas

O GPT-5.4 mini está disponível na API, no Codex e no ChatGPT. Usuários das versões Free e Go acessam o modelo através da opção Thinking. Outros usuários podem vê-lo como alternativa quando atingem limites no GPT-5.4 Thinking. O modelo nano está limitado à API.

A OpenAI promove um fluxo de trabalho com múltiplos modelos. Desenvolvedores podem dividir o trabalho entre níveis. Assim, um modelo maior faz o planejamento. Porém, modelos menores lidam com a execução.

Essa configuração reflete como muitas aplicações reais já funcionam. Um modelo pode revisar uma base de código ou decidir sobre mudanças. Outro processa dados de suporte ou etapas repetitivas. O modelo menor lida com o trabalho previsível. Por outro lado, o maior se concentra em julgamento e coordenação.

O CTO da Hebbia, Aabhas Sharma, relatou que o GPT-5.4 mini igualou ou superou modelos concorrentes em várias tarefas a um custo menor. “Em alguns casos, até entregou resultados de ponta a ponta mais fortes do que o GPT-5.4 completo”, afirmou.

Para desenvolvedores que constroem recursos de inteligência artificial em tempo real, modelos menores agora são capazes de lidar com uma parcela maior do trabalho cotidiano. Assim, a escolha do equilíbrio certo entre velocidade, custo e capacidade se torna uma decisão cada vez mais prática.

Assine a newsletter do Giz Brasil