_Outro Prompt_

Google sobe o nível do Gemini Pro; o que os benchmarks dizem

Modelo alcançou primeiro lugar em classificação que avalia desempenho em tarefas profissionais segundo sistema APEX

Google sobe o nível do Gemini Pro; o que os benchmarks dizem

O Google lançou o Gemini 3.1 Pro, nova versão de seu modelo de inteligência artificial (IA). A empresa divulgou o a novidade na última semana em formato de prévia. O lançamento mais amplo está previsto para ocorrer em breve.

A versão 3.1 representa evolução em relação ao Gemini 3, lançado em novembro. De acordo com alguns especialistas do setor, houve melhorias significativas na nova versão do sistema.

O Google compartilhou resultados de testes de referência independentes. Entre eles está o “Humanity’s Last Exam”, que registrou desempenho superior ao modelo anterior. Conforme os dados divulgados, o sistema demonstra maior capacidade para realizar diferentes tipos de tarefas.

O sistema APEX avaliou o novo modelo. Desenvolvido pela startup Mercor, o APEX mede desempenho de modelos de inteligência artificial em tarefas profissionais reais. O Gemini 3.1 Pro alcançou o primeiro lugar na classificação APEX-Agents.

Brendan Foody é CEO da Mercor comentou os resultados em publicação nas redes sociais. “O Gemini 3.1 Pro está agora no topo da classificação APEX-Agents“, afirmou Foody. Além disso, ele acrescentou que os resultados impressionantes do modelo mostram “quão rapidamente os agentes estão melhorando no trabalho de conhecimento real“.

O lançamento ocorre durante período de competição acirrada no setor de tecnologia. Empresas continuam desenvolvendo modelos de linguagem de grande escala cada vez mais avançados. Esses modelos são projetados para trabalho agêntico e raciocínio de múltiplas etapas.

Outras companhias do setor também lançaram novos modelos recentemente. OpenAI e Anthropic, por exemplo, duas gigantes do setor estão entre as empresas que disponibilizaram atualizações de seus sistemas próprios.

O novo modelo está acessível através da plataforma do Google, mas a empresa não especificou data exata para o lançamento mais amplo após o período de prévia.

Sair da versão mobile