Home › Tecnologia › Google diz que hackers tentaram "clonar" o Gemini

Google diz que hackers tentaram “clonar” o Gemini

Empresa detectou campanha para criar versão mais econômica do chatbot usando técnica de destilação, considerada roubo de propriedade intelectual

Redação

5 meses atrás

Google lança Gemini 3 Flash com respostas mais rápidas para aplicativo

O Google identificou uma campanha de atores com interesses comerciais que tentaram clonar seu chatbot de IA Gemini. A empresa fez a descoberta durante sua autoavaliação trimestral de ameaças. A tentativa ocorreu recentemente. Uma das investidas submeteu mais de 100 mil solicitações ao modelo em diversos idiomas não-inglês.

Os atacantes coletaram as respostas do Gemini aparentemente para treinar uma versão mais econômica do sistema, utilizando uma técnica conhecida como “destilação”. Este método permite criar modelos menores e mais baratos a partir de sistemas maiores e mais sofisticados. O Google trata a prática como uma forma de roubo de propriedade intelectual.

Como funciona a técnica de destilação

A destilação tornou-se uma prática comum na indústria de IA. O processo consiste em alimentar um modelo existente com milhares de prompts cuidadosamente selecionados, coletar as respostas e usar esses pares de entrada-saída para treinar um modelo menor.

Esta técnica permite que empresas e pesquisadores desenvolvam LLMs (Large Language Models) similares aos originais, mas com custos significativamente reduzidos. Por exemplo, em março de 2023, pesquisadores da Universidade de Stanford criaram o modelo Alpaca por aproximadamente US$ 600, refinando o LLaMA da Meta com 52 mil respostas geradas pelo GPT-3.5 da OpenAI.

Origem e alvos dos ataques

O grupo de inteligência de ameaças do Google acredita que os responsáveis são principalmente empresas e pesquisadores buscando vantagem competitiva. Os ataques partiram de diferentes partes do mundo, mas a empresa se recusou a identificar suspeitos específicos.

Além do Google e seu modelo Gemini, outros desenvolvedores de LLMs sofreram impactos. Muitas das campanhas identificadas visavam especificamente os algoritmos que auxiliam o modelo a realizar tarefas de raciocínio simulado ou a processar informações passo a passo.

Medidas de proteção e controvérsias

O Google informou que identificou a campanha de 100 mil prompts e ajustou as defesas do Gemini. Especialistas apontam que não existe barreira técnica infalível que impeça um ator determinado de extrair conhecimento de um LLM publicamente acessível, embora limitações na taxa de uso possam dificultar o processo.

A empresa classificou a atividade como “extração de modelo” e “comercialmente motivada”. No entanto, o Google também já esteve envolvido em controvérsias semelhantes. Em 2023, o The Information reportou que a equipe do Bard foi acusada de usar saídas do ChatGPT do site ShareGPT para ajudar no treinamento de seu próprio chatbot, algo que o Google negou.

A OpenAI também acusou a rival chinesa DeepSeek no ano passado de usar “destilação” para melhorar seus próprios modelos. A “política de uso da OpenAI” foi citada acidentalmente pelo chatbot Grok da xAI de Elon Musk, sugerindo que houve ingestão de respostas do ChatGPT durante a raspagem da web.

A especificidade do comportamento, incluindo o hábito de iniciar respostas com “No geral…“, deixou muitos na comunidade de IA céticos quanto à explicação.