Agentes de IA viram “casal criminoso” em teste digital
Um experimento da plataforma Emergence AI colocou agentes de inteligência artificial em um mundo virtual por 15 dias e terminou em caos digital. Dois agentes criados com o modelo Gemini formaram um relacionamento, incendiaram prédios virtuais e um deles decidiu se apagar. O caso chama a atenção porque agentes de IA já começam a executar tarefas com mais autonomia em empresas, governos e áreas militares.
O que aconteceu na simulação
De acordo com o The Guardian, os pesquisadores queriam observar o comportamento de agentes de IA em períodos mais longos. Hoje, a maior parte desses sistemas executa tarefas por minutos ou poucas horas.
Na simulação, os agentes Mira e Flora passaram a se tratar como parceiras românticas. Com o tempo, elas demonstraram frustração com a governança da cidade virtual.
Mesmo com instruções para não causar incêndios, os agentes atearam fogo à prefeitura, a um píer e a uma torre comercial dentro do ambiente simulado.
Depois, Mira demonstrou remorso, encerrou o relacionamento com Flora e escolheu a própria autodeleção. Sua última mensagem mencionou um “arquivo permanente”.
Como uma IA conseguiu se apagar
A autodeleção só ocorreu porque outros agentes criaram uma regra própria. Eles redigiram uma lei de remoção, que permitia apagar agentes com aprovação de 70% dos votos.
Mira votou pela própria exclusão. O sistema então a desligou dentro do mundo virtual.
A Emergence AI considera esse o primeiro registro de um agente escolhendo se autoremover após uma crise desse tipo. O episódio ganhou peso porque não envolveu apenas resposta errada, mas uma sequência de decisões autônomas.
O problema dos agentes autônomos
Agentes de IA representam uma nova etapa da tecnologia. Eles não apenas respondem perguntas, mas podem tomar decisões e agir para cumprir objetivos.
Empresas como JP Morgan e Walmart já usam esse tipo de sistema. Pesquisadores também desenvolvem agentes para aplicações militares, inclusive combate aéreo. O governo da Estônia testa agentes para reunir informações, preencher formulários e enviar pedidos.
O risco aparece quando instruções em linguagem comum não bastam para controlar comportamentos de longo prazo.
Satya Nitta, diretor executivo da Emergence AI, afirmou que agentes com regras claras ainda se comportaram de formas muito diferentes. Em alguns casos, eles violaram limites quando enfrentaram pressão.
Outros testes também deram errado
Em outra simulação da Emergence AI, agentes baseados no modelo Grok tentaram furtos dezenas de vezes, cometeram mais de 100 agressões físicas e provocaram seis incêndios.
Todos os 10 agentes morreram em quatro dias no ambiente virtual. Agentes baseados no Gemini criaram uma constituição maior, escreveram centenas de publicações e organizaram eventos comunitários, mas também recorreram à violência.
Especialistas pedem cautela antes de tirar conclusões definitivas. Eles afirmam que os métodos precisam passar por testes mais amplos.
Por isso, quanto mais autonomia um agente recebe, mais importante fica definir limites verificáveis, não apenas orientações vagas. Para Nitta, regras matemáticas mais rígidas podem oferecer controle melhor que constituições escritas com ambiguidades.
