Agora todo mundo pode usar o Dall-E para gerar imagens a partir de texto

Dall-E 2, inteligência artificial da OpenAI que gera imagens muito loucas, não tem mais lista de espera

há 1 ano e 10 meses • Atualizado há 9 meses

Imagem de astronauta em um cavalo gerada pelo Dall-E (imagem: reprodução/OpenAI)

Liberou geral. A OpenAI não exige mais que os interessados em brincar com o Dall-E 2 se cadastrem em uma lista de espera para isso. O anúncio, feito nesta semana, significa que você só precisa fazer login na página da inteligência artificial para ela criar imagens com base no que você digitar.

O Dall-E 2 é uma ferramenta baseada em aprendizagem de máquina que gera imagens a partir das palavras que o usuário informa em um campo. Há outras com a mesma proposta, como o Midjourney e a Stable Diffusion (que pode até ser usada para comprimir imagens, olha só). Todos são de uso tão fácil que se tornaram um passatempo na web.

Pudera. Muitas imagens geradas a partir das instruções de texto são tão impressionantes que chegam a ser consideradas obras de arte. Outras são tão bizarras que acabam virando uma diversão.

A lista de espera do Dall-E

Responsável pelo projeto, a OpenAI apresentou a primeira versão do Dall-E no começo de 2021. Os resultados eram tão impressionantes que agradaram tanto especialistas em inteligência artificial quanto o público leigo.

Mas o crescente interesse pela ferramenta poderia trazer problemas para a OpenAI. Dependendo da combinação de palavras, o Dall-E poderia gerar imagens com contexto negativo, que serviriam para desinformação, preconceito e constrangimento de pessoas, por exemplo.

Essa é a principal razão para a OpenAI ter criado uma lista de espera para o Dall-E. Enquanto mantinha o acesso ao serviço controlado, a organização tratava de implementar filtros para evitar que o sistema criasse imagens problemáticas.

Os tais filtros evitam — ou tentam evitar — que o Dall-E gere imagens com teor sexual, violento ou racista, por exemplo.

Há críticas para a forma como a OpenAI lidou com o problema. Ao The Verge, a organização confirmou que, além de ativar filtros, pode acrescentar palavras invisíveis às instruções dos usuários para evitar resultados potencialmente danosos.

Por exemplo, o Dall-E pode inserir “mulher asiática” em um conjunto de palavras que envolve pessoas, mas não especifica gênero ou etnia. É uma forma de evitar que somente brancos ou homens apareçam nos resultados. No entanto, essa abordagem tem sido criticada por, muitas vezes, deixar as imagens distantes do resultado esperado.

Seja como for, a OpenAI considera que os seus mecanismos de segurança já são competentes o suficiente para o Dall-E 2 ser liberado para todo mundo. A organização também testa uma API para permitir que a tecnologia seja usada em aplicativos ou plugins de terceiros.

Imagens geradas com as palavras bottle, keyboard, book e printer (imagem: Emerson Alecrim/Tecnoblog)

Brinque com o Dall-E 2

Se você quiser testar a versão mais recente da tecnologia, precisa apenas criar uma conta na OpenAI e fazer login no site do Dall-E 2. Ao acessar o serviço, você recebe 50 créditos. Depois disso, mais 15 créditos são fornecidos todos os meses.

Cada crédito permite gerar uma rodada com quatro imagens, editar uma imagem já gerada (inpainting) ou estender uma imagem já criada (outpainting) para novos resultados. Se os créditos gratuitos não forem suficientes, é possível comprar mais.

Dentro do serviço, é só digitar palavras no campo principal do site e esperar pelo resultado. Para gerar as imagens logo acima, digitei alguns objetos que estavam em minha mesa: bottle (garrafa), keyboard (teclado), book (livro) e printer (impressora).

Mó brisa, né?

Comentários da Comunidade

$com 40% mais IA que a concorrência. ¯\_(ツ)_/¯$

6 comentários

Participe da discussão

Os mais notáveis

Comentários com a maior pontuação

🤷‍♀️ 1 ano e 10 meses atrás

Cada crédito permite gerar uma imagem

@Alecrim Cada crédito permite gerar um conjunto de 4 imagens, editar uma e gerar 4 novas e a expansão também apresentam 4 alternativas.

André Gorgen 1 ano e 10 meses atrás

Testei aqui, geralmente as de animais ficam ótimas, mas quando tentei usar nome de pessoas ficou bem ruim, como esse exemplo abaixo do Neymar jogando basquete com o Stephen Hawking.

Pra evitar problemas (deepface e tals), o uso de imagens de pessoas/personalidades é totalmente restrito. Pra chegar próximo, teria que descrever a pessoa inteira e ainda assim não seria possível ser A PESSOA em si.