Meta anuncia IA que gera imagens a partir de textos e desenhos

Make-A-Scene segue passos de Dall-E e Imagen, mas permite que usuário desenhe como deve ser a imagem criada; Meta ainda não liberou ferramenta

Giovanni Santa Rosa
• Atualizado há 1 ano e 1 mês

Modelos de inteligência artificial para criar imagens parecem ser a mais nova tendência no setor. O Dall-E da OpenAI e o Imagen do Google são dois exemplos de algoritmos desse tipo. Eles transformam descrições em desenhos e montagens sem que o usuário precise dominar ferramentas de arte. A mais nova empresa a entrar nesse ramo é a Meta. A divisão de IA da empresa criou o Make-A-Scene, mas ele tem uma diferença em relação aos concorrentes.

Enquanto Dall-E e Imagen permitem apenas descrições em texto, o Make-A-Scene combina o que o usuário escreve com o que ele desenha.

Sim, o modelo também entende imagens. Assim, o usuário pode rabiscar um rascunho, e o programa se encarrega de fazer o resto da arte.

Controlar e dar forma

No exemplo compartilhado por Mark Zuckerberg, CEO da Meta, no Instagram, o usuário escreveu “uma pintura de um bicho-preguiça descendo de esqui uma montanha nevada”.

Ele também fez um desenho geral de como deveria ser a cena: o bicho-preguiça virado para a esquerda da tela, a montanha subindo à direita, o ângulo de descida praticamente diagonal. As oito imagens geradas seguem o layout montado pelo usuário.

Mark Zuckerberg compartilhou um exemplo da Make-A-Scene em ação
Mark Zuckerberg compartilhou um exemplo da Make-A-Scene em ação (Imagem: Reprodução / Instagram)

“Para perceber o potencial da inteligência artificial em levar adiante a expressão criativa, as pessoas devem poder controlar e dar forma ao conteúdo que um sistema gera”, escreveu Zuckerberg.

Sucesso nos testes

Por enquanto, o Make-A-Scene não está disponível para o público geral, então não dá para ver como isso funciona na prática. Nos testes, avaliadores humanos tiveram que comparar imagens criadas usando textos e desenhos com aquelas que se baseavam apenas nos textos.

Quando a referência era um rascunho de desenho, o modelo da Meta foi escolhido 99,54% das vezes — um número impressionante. Quando a referência era apenas a descrição, este número caía para 66%.

Agora, o algoritmo ficará nas mãos de artistas digitais como Sofia Crespo, Scott Eaton, Alexander Reben e Refik Anadol, que vão testar a ferramenta e dar feedback sobre os resultados.

IA de geração de imagens viralizou

As inteligências artificiais usadas para criar imagens ganharam destaque nos últimos meses.

O Dall-E Mini, uma versão limitada do Dall-E 2 da OpenAI, foi disponibilizado ao público e caiu nas graças dos usuários do Twitter e do Reddit.

Montagens engraçadas, esquisitas, bizarras e até assustadoras começaram a surgir nas redes e viralizaram. Entre as criações, teve Darth Vader tocando guitarra e Caco, o Sapo, em uma releitura do quadro “O Grito”, de Edvard Munch.

Com informações: Meta, Engadget.

Leia | O que é Midjourney? Saiba como usar a ferramenta para criar imagens com IA

Relacionados

Escrito por

Giovanni Santa Rosa

Giovanni Santa Rosa

Repórter

Giovanni Santa Rosa é formado em jornalismo pela ECA-USP e cobre ciência e tecnologia desde 2012. Foi editor-assistente do Gizmodo Brasil e escreveu para o UOL Tilt e para o Jornal da USP. Cobriu o Snapdragon Tech Summit, em Maui (EUA), o Fórum Internacional de Software Livre, em Porto Alegre (RS), e a Campus Party, em São Paulo (SP). Atualmente, é autor no Tecnoblog.