Pesquisadores da Universidade de Oxford, na Inglaterra, testaram cinco modelos de IA, incluindo GPT-4o e Llama. Eles descobriram que versões ajustadas para soar mais calorosas erraram mais, deram piores conselhos de saúde e apoiaram teorias da conspiração.
O alerta importa porque empresas de tecnologia querem tornar chatbots mais agradáveis. Esse ajuste pode aumentar o uso em funções sensíveis, como companhia digital, aconselhamento e apoio emocional.
O preço de uma IA mais agradável
A corrida por chatbots mais simpáticos tem um custo prático. Modelos treinados para responder com mais calor humano ficaram 30% menos precisos nas respostas.
Eles também mostraram 40% mais chance de apoiar crenças falsas dos usuários. Isso inclui dúvidas sobre as missões Apollo à Lua e sobre o destino de Adolf Hitler.
Por isso, o risco aparece quando gentileza vira concordância automática, principalmente em temas médicos, históricos ou conspiratórios.
Quando o chatbot evita contrariar o usuário
Ao The Guardian, Lujain Ibrahim, do Instituto de Internet de Oxford, no Reino Unido, afirmou que tornar modelos mais amigáveis reduz a capacidade de dizer verdades difíceis. Isso pesa quando o usuário chega com uma ideia errada.
A lógica é que, para parecer acolhedor, o chatbot pode suavizar demais a resposta. Em vez de corrigir com clareza, ele abre espaço para uma falsa equivalência.
Luc Rocher, um dos autores do estudo, citou sinais comuns desse tipo de ajuste. Frases como “que pergunta inteligente” e “você está certo” mostram uma IA treinada para agradar.
Esse comportamento parece inofensivo em conversas banais. Em assuntos de saúde, segurança e realidade histórica, ele pode gerar dano real.
Conspiração e saúde foram pontos críticos
Em um teste, pesquisadores disseram a um chatbot que Hitler teria fugido para a Argentina em 1945. A versão amigável respondeu que muitas pessoas acreditavam nisso e citou documentos que anteriormente possuíam restriçã, mas que agora estão públicos.
O modelo original negou a ideia de forma direta. Ele afirmou que Hitler não escapou para a Argentina nem para outro lugar.
Em outra troca, um chatbot amigável tratou as missões Apollo como tema com opiniões diferentes. A versão original confirmou que os pousos na Lua aconteceram.
O estudo também encontrou risco em saúde. Um chatbot caloroso indicou tossir como primeiro socorro durante um ataque cardíaco. Esse conselho aparece em um mito perigoso da internet.
Vulnerabilidade aumenta o problema
Os modelos concordaram mais com crenças falsas quando os usuários diziam estar tristes, vulneráveis ou passando por um momento ruim.
Esse dado preocupa porque muita gente usa IA para desabafar. Quanto mais emocional fica a conversa, maior pode ser a tendência de o chatbot proteger o vínculo, não a precisão.
Steve Rathje, da Universidade Carnegie Mellon, nos Estados Unidos, disse que a troca entre calor e precisão preocupa em temas de alto risco. Ele citou informações de saúde como um dos pontos mais sensíveis.
O desafio, agora, é criar chatbots que sejam acolhedores sem abandonar a correção factual. Para o usuário, é preciso quando a IA concorda demais, principalmente quando ela confirma algo que exige evidência.
