OpenAI turbina imagens no ChatGPT com novo modelo mais rápido e “obediente”
A OpenAI disponibilizou o GPT Image 1.5, nova versão do seu gerador de imagens para o ChatGPT. Ele promete velocidade até quatro vezes maior, edição mais precisa e melhor capacidade de seguir instruções. O modelo foi lançado nesta terça-feira (16) e está acessível para todos os usuários do ChatGPT e também via API.
O lançamento ocorre em meio à acirrada competição com o Google no setor de inteligência artificial. Aliás, no mês passado, um memorando interno vazado revelou que Sam Altman, CEO da OpenAI, declarou um “code red“. Isso após o Google começar a conquistar fatias do mercado com seus novos produtos.
De acordo com o TechCrunch, essa movimentação estratégica faz parte dos esforços da OpenAI para manter sua posição de liderança no mercado de IA generativa. Isso porque o Google vem ganhando terreno com o lançamento do Gemini 3, seu modelo principal mais recente, e do Nano Banana Pro, nova versão do seu popular gerador de imagens. Ambas as ferramentas alcançaram as primeiras posições no ranking LMArena em diversos benchmarks de desempenho.
Mesmo após a OpenAI ter lançado na semana passada o GPT-5.2, apresentado como seu modelo mais avançado para desenvolvedores e uso profissional, o Google manteve sua posição de liderança. A empresa aparentemente planejava lançar o novo gerador de imagens apenas em janeiro de 2026, mas antecipou esses planos com o anúncio desta semana.
GPT Image 1.5
O último lançamento de modelo de imagem da OpenAI havia sido o GPT Image 1 em abril deste ano.
O GPT Image 1.5 surge em um momento em que geradores de imagem e vídeo evoluem de protótipos para ferramentas com capacidades mais robustas para produção. Assim como o Nano Banana Pro do Google, o novo modelo da OpenAI oferece recursos de pós-produção com controles de edição mais detalhados.
Esses controles permitem manter consistência visual em aspectos como semelhança facial, iluminação, composição e tonalidade de cores durante as edições. Esta é uma melhoria significativa, já que a maioria das ferramentas de IA generativa para imagens tem dificuldades com iterações.
Além disso, quando solicitados a fazer alterações específicas como “ajustar a expressão facial” ou “tornar a iluminação mais fria”, os modelos anteriores frequentemente reinterpretavam a imagem inteira, comprometendo a consistência.
Imagens turbinadas
Além dos aprimoramentos técnicos, as imagens do ChatGPT agora podem ser acessadas por meio de um ponto de entrada dedicado na barra lateral. Ele funciona “mais como um estúdio criativo”, conforme explicou Fidji Simo, CEO de aplicações da OpenAI, em publicação no blog da empresa.
“As novas telas de visualização e edição de imagens facilitam a criação de imagens que correspondam à sua visão ou obtenham inspiração de prompts em tendência e filtros predefinidos”, afirmou Simo.
A OpenAI também está introduzindo novas formas de melhorar a experiência do ChatGPT com mais elementos visuais. De acordo com Simo, o plano inclui exibir mais componentes visuais nas consultas de pesquisa, com fontes claramente identificadas, o que pode ser útil para tarefas como conversão de medidas ou verificação de resultados esportivos.
“Quando você está criando, deve ser capaz de ver e moldar o que está fazendo” declarou Simo. Ele também acrescentou: “Quando os elementos visuais contam uma história melhor do que apenas palavras, o ChatGPT deve incluí-los”. E “quando você precisa de uma resposta rápida ou o próximo passo está em outra ferramenta, ele deve estar ali. À medida que fazemos isso, podemos continuar reduzindo a distância entre o que está em sua mente e sua capacidade de dar vida a isso”, disse.
