2023 © Copyright 404 - Todos os direitos reservados

IA já aprende sozinha criando perguntas e desafios para si mesma

Modelo Absolute Zero Reasoner gera problemas de codificação, tenta resolvê-los e verifica seu trabalho para aprimorar habilidades de raciocínio sem intervenção humana.

Um grupo de cientistas da Universidade Tsinghua, do Instituto de Pequim para Inteligência Artificial Geral (BIGAI) e da Universidade Estadual da Pensilvânia, criou um sistema de IA capaz de aprender sem intervenção humana.

O sistema, denominado Absolute Zero Reasoner (AZR), funciona gerando suas próprias perguntas e utilizando código de computador para desenvolver habilidades de raciocínio.

Como o AZR funciona

O AZR opera através de um processo de três etapas: primeiro gera problemas desafiadores de codificação em Python, depois tenta resolvê-los e, por fim, verifica seu trabalho executando o código. Os resultados obtidos servem como feedback para aprimorar o modelo original. Segundo reportagem da Wired, que acompanhou o desenvolvimento do projeto, esta abordagem representa uma inovação significativa na forma como os sistemas de IA são treinados.

Esta solução representa uma mudança significativa nos métodos convencionais de treinamento de IA, que geralmente dependem de exemplos criados por humanos. Em vez disso, o AZR busca simular o aprendizado humano ao identificar questões relevantes por conta própria.

“No começo você imita seus pais e faz como seus professores, mas depois você basicamente tem que fazer suas próprias perguntas. E eventualmente você pode superar aqueles que te ensinaram na escola”, explicou Andrew Zhao, estudante de doutorado da Universidade Tsinghua e um dos idealizadores do projeto.

A ideia original do Absolute Zero surgiu de Zhao, que trabalhou em colaboração com Zilong Zheng, pesquisador do BIGAI. O desenvolvimento envolveu esforços conjuntos entre as instituições chinesas e americanas mencionadas.

Os testes realizados com o sistema mostraram avanços consideráveis nas versões de 7 bilhões e 14 bilhões de parâmetros do modelo de linguagem de código aberto Qwen. Um resultado notável foi que o modelo conseguiu superar alguns sistemas que haviam sido treinados com dados selecionados por humanos.

“O nível de dificuldade cresce à medida que o modelo se torna mais poderoso”, destacou Zilong Zheng. Ele também comentou sobre o potencial futuro da tecnologia: “Uma vez que tenhamos isso, é uma espécie de caminho para alcançar a superinteligência”.

Big techs investem em soluções parecidas

A abordagem do Absolute Zero já está ganhando adeptos em importantes laboratórios de IA. Projetos semelhantes estão surgindo em empresas como Salesforce e Meta.

Um exemplo é a tecnologia desenvolvida por Salesforce, Stanford e a Universidade da Carolina do Norte em Chapel Hill, que envolve um agente de software que utiliza ferramentas e se aprimora através de “autocompetição”.

Além disso, pesquisadores da Meta, da Universidade de Illinois e da Carnegie Mellon University apresentaram recentemente um sistema que emprega método similar para engenharia de software. Os autores deste trabalho indicam que a pesquisa representa “um primeiro passo em direção a paradigmas de treinamento para agentes de software superinteligentes.”

Embora o sistema atual funcione apenas com problemas facilmente verificáveis, espera-se que evolua para lidar com tarefas de IA mais complexas. A expectativa é de que ele receba suporte para navegação na web ou execução de atividades administrativas.

Assine a newsletter do Giz Brasil