Home › Outro Prompt_ › Perfil anônimo pode não estar tão protegido da IA

Perfil anônimo pode não estar tão protegido da IA

Pesquisa de 2026 revela que modelos de linguagem conseguem desanonimizar perfis no Reddit, Hacker News e LinkedIn com precisão superior aos métodos tradicionais de identificação.

Redação

4 meses atrás

Modelos de linguagem de grande escala revelam a identidade de pessoas que usam pseudônimos em plataformas digitais. Pesquisadores publicaram em 2026 um estudo mostrando que a tecnologia consegue desanonimizar até 68% dos perfis analisados. O trabalho correlacionou indivíduos específicos com contas ou publicações no Reddit, Hacker News e LinkedIn.

Cientistas realizaram três experimentos distintos para avaliar a capacidade de agentes de inteligência artificial em identificar usuários que acreditavam estar protegidos pelo anonimato online. A taxa de sucesso superou significativamente os métodos clássicos de desanonimização. Esses métodos dependiam de humanos montando conjuntos de dados estruturados adequados para correspondência algorítmica ou trabalho manual de investigadores qualificados.

Os agentes de IA demonstraram habilidade para navegar na web e interagir de maneiras semelhantes aos humanos. A tecnologia utiliza raciocínio simulado para corresponder potenciais indivíduos. Diferentemente de abordagens anteriores, consegue processar texto livre, como transcrições de entrevistas anonimizadas, e trabalhar até chegar à identidade completa de uma pessoa.

Avanços em modelos de linguagem possibilitam nova forma de ataque à privacidade

Os avanços recentes nas capacidades dos modelos de linguagem tornaram possível uma nova forma de ataque à privacidade online. Simon Lermen, coautor do estudo, explicou: “o que descobrimos é que esses agentes de IA podem fazer algo que anteriormente era muito difícil: partindo de texto livre (como uma transcrição de entrevista anonimizada), eles podem trabalhar até chegar à identidade completa de uma pessoa”.

Métodos tradicionais de desanonimização geralmente necessitavam de dados estruturados. Dois conjuntos de dados com esquemas similares precisavam de conexão. Lermen afirmou: “esta é uma capacidade bastante nova; abordagens anteriores sobre reidentificação geralmente exigiam dados estruturados e dois conjuntos de dados com esquema similar que pudessem ser vinculados”.

Experimentos analisaram usuários de múltiplas plataformas

Os experimentos envolveram usuários de diversas plataformas de mídia social. No primeiro teste, 125 participantes que responderam a um questionário da Anthropic sobre como utilizam IA em suas vidas diárias tiveram suas identidades analisadas. Os pesquisadores conseguiram identificar positivamente 7% dos participantes usando informações extraídas das respostas.

No segundo experimento, foram examinados usuários que comentaram no subreddit r/movies e em pelo menos uma de cinco comunidades menores: r/horror, r/MovieSuggestions, r/Letterboxd, r/TrueFilm e r/MovieDetails. Os comentários analisados foram coletados em 2024.

Os resultados variaram conforme a quantidade de filmes compartilhados pelos usuários. Quando os usuários mencionavam apenas um filme, 3,1% deles podiam ser identificados com 90% de precisão. A taxa de identificação com 99% de precisão alcançou 1,2% dos usuários.

Ao compartilharem entre cinco e nove filmes, as taxas subiram para 8,4% dos usuários identificados com 90% de precisão. A identificação com 99% de precisão alcançou 2,5% dos usuários. Quando os usuários discutiam mais de 10 filmes, os percentuais saltaram para 48,1% e 17%, respectivamente.

O terceiro experimento utilizou um conjunto inicial de 5.000 usuários do Reddit. Os pesquisadores adicionaram 5.000 identidades de “distração” de outros usuários à base de candidatos. Posteriormente, incluíram à lista de 10.000 perfis candidatos mais 5.000 elementos distratores de consulta. Esses elementos eram compostos por usuários que aparecem apenas no conjunto de consulta, sem correspondência verdadeira na base de candidatos.

Os pesquisadores também coletaram dados de publicações do Hacker News e perfis do LinkedIn. Vincularam essas informações usando referências entre plataformas que apareciam nos perfis dos usuários. Um dos conjuntos de dados tinha origem em uma divulgação da Netflix contendo micro-identidades, como preferências individuais, recomendações e registros de transações.

Modelos de linguagem superam métodos clássicos de identificação

Os pesquisadores escreveram sobre a comparação entre métodos clássicos e baseados em modelos de linguagem: “(a) A precisão dos ataques clássicos cai muito rapidamente, explicando sua baixa taxa de recuperação. Em contraste, a precisão dos ataques baseados em modelos de linguagem decai de forma mais gradual conforme o atacante faz mais suposições. (b) O ataque clássico quase falha completamente mesmo com precisão moderadamente baixa. Em contraste, mesmo o ataque mais simples baseado em modelo de linguagem (Busca) alcança recuperação não trivial com baixa precisão, e estendê-lo com etapas de Raciocínio e Calibração dobra a Recuperação com 99% de Precisão.”

Um artigo de pesquisa de 2008 mostrou que, usando o que ficou conhecido como ataque do prêmio Netflix, a lista poderia identificar usuários e suas afiliações políticas e outras informações pessoais. A última técnica dividiu o histórico do Reddit de um único usuário.

Pesquisadores propõem medidas de proteção

A capacidade de identificar de forma barata e rápida as pessoas por trás de contas obscurecidas as expõe a doxxing, perseguição e montagem de perfis de marketing detalhados. Esses perfis rastreiam onde os usuários vivem, o que fazem para viver e outras informações pessoais. A medida de pseudonimato não se sustenta mais.

Os pesquisadores propuseram medidas de mitigação para enfrentar essa ameaça à privacidade. As plataformas poderiam impor limites de taxa no acesso via API aos dados dos usuários. Poderiam detectar raspagem automatizada e restringir exportações de dados em massa.

Os provedores de modelos de linguagem também poderiam monitorar o uso indevido de seus modelos em ataques de desanonimização. Poderiam construir proteções que façam os modelos recusarem solicitações de desanonimização.

Outra opção seria as pessoas reduzirem drasticamente o uso de redes sociais. No mínimo, poderiam excluir regularmente publicações após um período definido.

Caso o sucesso dos modelos de linguagem em desanonimizar pessoas melhore, os pesquisadores alertam que governos poderiam usar as técnicas para desmascarar críticos online. Corporações poderiam montar perfis de clientes para “publicidade hiper-segmentada”. Atacantes poderiam construir perfis de alvos em escala para lançar golpes de engenharia social altamente personalizados.

A descoberta tem potencial para subverter o pseudonimato, uma medida de privacidade imperfeita, mas frequentemente suficiente. Muitas pessoas usam pseudônimos para postar consultas e participar de discussões públicas às vezes sensíveis. A técnica dificulta que outros identifiquem positivamente os interlocutores.