IA do Google transforma qualquer texto escrito em imagens fotorrealistas
Inteligência artificial é capaz de transformar descrições como "casal de robôs em um jantar fino com a Torre Eiffel ao fundo" em imagens
Inteligência artificial é capaz de transformar descrições como "casal de robôs em um jantar fino com a Torre Eiffel ao fundo" em imagens
A inteligência artificial parece ter alcançado um novo marco, desta vez pelas mãos do Google. Um programa chamado Imagen promete transformar qualquer texto descritivo em uma imagem. Qualquer texto mesmo, até os mais malucos que você pensar.
O site da ferramenta traz alguns exemplos bastante complexos, para não dizer surreais:
Em todos os casos, os resultados são imagens muito bem acabadas. Elas parecem feitas em um programa de ilustração, modelagem 3D ou edição de fotografias.
A página traz uma pequena demonstração, bem mais limitada do que a inteligência artificial promete. Nela, você tem opções de estilo de imagem, animal, roupas, acessórios, atividades e cenários. É só combinar e receber sua imagem.
Os resultados são quase sempre ótimos — as fotos de panda e guaxinim usando óculos escuros não deram certo, mas de resto, as imagens se encaixam perfeitamente na descrição.
Segundo o Google, sua inteligência artificial bateu a DALL-E, da OpenAI, em um benchmark que a própria empresa criou. O teste consiste em colocar os programas para criarem 200 imagens a partir de descrições predefinidas e depois colocá-las sob avaliação de humanos.
Modelos de texto-para-imagem como estes permitiriam que pessoas criem ilustrações e montagens sem precisar saber operar programas como Photoshop, por exemplo. Mas não agora.
O Google não liberou a ferramenta para teste. Por isso, não dá para dizer se qualquer descrição vai virar uma imagem tão boa assim ou se a empresa só selecionou os melhores resultados para mostrar — partindo do princípio que não houve manipulação, obviamente.
Mas há um bom motivo para isso. Se o Imagen é tão poderoso quanto promete, ele pode ser usado para fake news, bullying e assédio. O Google também ressalta que o algoritmo aprende com imagens da internet, então pode codificar vieses sociais como racismo, sexismo ou comportamentos tóxicos.
O DALL-E, “concorrente” do Imagen, está em fase beta e disponível apenas para usuários selecionados. Ele filtra entradas de texto para evitar que o modelo seja usado para criar imagens racistas, violentas ou pornográficas.
O Google diz que o Imagen não é adequado para uso público neste momento.
Com informações: Cnet, The Verge.
Leia | O que é Midjourney? Saiba como usar a ferramenta para criar imagens com IA