Novos projetos tentam transformar ChatGPT em IA “autônoma”

Auto-GPT e BabyAGI tentam usar respostas do próprio ChatGPT para levá-lo a realizar tarefas mais complexas, sem precisar de intervenção

Giovanni Santa Rosa
Por
ChatGPT (imagem: Emerson Alecrim/Tecnoblog)
ChatGPT (imagem: Emerson Alecrim/Tecnoblog)

O ChatGPT é um avanço impressionante na inteligência artificial, por conseguir entender muitos pedidos feitos em linguagem natural e dar respostas complexas. Mesmo assim, ele depende de um humano dando comandos. E se isso não fosse necessário? Alguns desenvolvedores estão construindo ferramentas com este objetivo, como o Auto-GPT e o BabyAGI.

Tanto o Auto-GPT quanto o BabyAGI apareceram em uma reportagem do site Ars Technica. Eles têm abordagens levemente diferentes, mas buscam um fim comum: uma inteligência artificial capaz de realizar tarefas sem precisar de um humano dando ordens.

O Auto-GPT tenta encadear várias respostas do GPT-4 e levar a tarefa mais adiante, para que ela seja realizada com menos interações do usuário. Ele roda localmente como um script Python ou em uma versão web mais limitada, chamada AgentGPT.

O programa funciona da seguinte forma: você dá um nome para seu agente e descreve um objetivo para ele. A partir daí, ele quebra aquele objetivo em tarefas menores e vai pedindo uma a uma para o GPT-4. Em alguns casos, a resposta de uma tarefa é usada na seguinte

Na versão local, o Auto-GPT precisa que o usuário forneça uma chave de API da OpenAI e outra da busca do Google. O AgentGPT não pede isso, mas encerra os trabalhos antes do fim, já que não pode rodar o agente por muito tempo, por causa de limitações de acesso.

Teoricamente, o script poderia buscar um produto na internet e selecionar automaticamente uma das lojas. Ele não poderia comprá-lo, já que não tem uma ferramenta específica para isso.

AgentGPT
AgentGPT (Imagem: Reprodução/Tecnoblog)

O BabyAGI funciona de maneira semelhante, com versões locais ou na web, em um site chamado God Mode. A grande diferença para o Auto-GPT é que você pode escolher o passo a passo.

Ao pedir para ele me ajudar a escolher um método de produtividade para quem tem tarefas com prazos curtos, ele me deu três etapas: identificar, avaliar, selecionar. Eu podia escolher quais dessas etapas queria seguir, ou adicionar novas.

A cada uma delas, eu precisava aprovar a sequência, e podia acrescentar novas instruções. Ou seja, ele está mais para automático, ao encadear as tarefas, do que autônomo, que resolveria tudo sozinho.

God Mode
God Mode (Imagem: Reprodução/Tecnoblog)

IA geral ainda é apenas imaginação

O nome do BabyAGI vem de “artificial general intelligence”, ou “inteligência artificial geral”.

Esta denominação é dada a uma IA que teria o poder de realizar praticamente qualquer tarefa, mesmo sem receber treinamento específico para ela. Os desenvolvedores do Auto-GPT e do BabyAGI dizem que este é o objetivo.

A Microsoft diz ter visto alguns indícios de comportamentos de AGI no GPT-4. Mesmo assim, um modelo desse tipo ainda é hipotético.

O que experimentos como Auto-GPT e BabyAGI mostram é que, por mais impressionante que o GPT-4 seja, ele ainda tem limites bastante definidos e não consegue ir muito longe do que treinou.

Um ponto importante sobre isso é que os LLMs (sigla para “large language models”, ou “grandes modelos de linguagem”) ainda “alucinam”, nome dado no jargão para quando a IA escreve alguma coisa sem base na realidade.

Ao fazer o GPT-4 ir ligando uma tarefa a outra, existe a possibilidade de ele alucinar no meio do caminho, com consequências no trajeto até o objetivo.

Por enquanto, o que sabemos é que as IAs existentes trabalham melhor em conjunto com humanos.

Um estudo do MIT mostrou que uma ferramenta de arquitetura com IA chega a melhores resultados quando recebe feedback humano para corrigir falhas a cada etapa.

Ou seja: ainda não dá para mandar a IA comprar um tênis ou escolher o melhor método de organização para suas necessidades.

Com informações: Ars Technica

Relacionados