Agora todo mundo pode usar o Dall-E para gerar imagens a partir de texto

Dall-E 2, inteligência artificial da OpenAI que gera imagens muito loucas, não tem mais lista de espera

Emerson Alecrim
Por
• Atualizado há 6 meses
Imagem de astronauta em um cavalo gerada pelo Dall-E (imagem: reprodução/OpenAI)
Imagem de astronauta em um cavalo gerada pelo Dall-E (imagem: reprodução/OpenAI)

Liberou geral. A OpenAI não exige mais que os interessados em brincar com o Dall-E 2 se cadastrem em uma lista de espera para isso. O anúncio, feito nesta semana, significa que você só precisa fazer login na página da inteligência artificial para ela criar imagens com base no que você digitar.

O Dall-E 2 é uma ferramenta baseada em aprendizagem de máquina que gera imagens a partir das palavras que o usuário informa em um campo. Há outras com a mesma proposta, como o Midjourney e a Stable Diffusion (que pode até ser usada para comprimir imagens, olha só). Todos são de uso tão fácil que se tornaram um passatempo na web.

Pudera. Muitas imagens geradas a partir das instruções de texto são tão impressionantes que chegam a ser consideradas obras de arte. Outras são tão bizarras que acabam virando uma diversão.

A lista de espera do Dall-E

Responsável pelo projeto, a OpenAI apresentou a primeira versão do Dall-E no começo de 2021. Os resultados eram tão impressionantes que agradaram tanto especialistas em inteligência artificial quanto o público leigo.

Mas o crescente interesse pela ferramenta poderia trazer problemas para a OpenAI. Dependendo da combinação de palavras, o Dall-E poderia gerar imagens com contexto negativo, que serviriam para desinformação, preconceito e constrangimento de pessoas, por exemplo.

Essa é a principal razão para a OpenAI ter criado uma lista de espera para o Dall-E. Enquanto mantinha o acesso ao serviço controlado, a organização tratava de implementar filtros para evitar que o sistema criasse imagens problemáticas.

Os tais filtros evitam — ou tentam evitar — que o Dall-E gere imagens com teor sexual, violento ou racista, por exemplo.

Há críticas para a forma como a OpenAI lidou com o problema. Ao The Verge, a organização confirmou que, além de ativar filtros, pode acrescentar palavras invisíveis às instruções dos usuários para evitar resultados potencialmente danosos.

Por exemplo, o Dall-E pode inserir “mulher asiática” em um conjunto de palavras que envolve pessoas, mas não especifica gênero ou etnia. É uma forma de evitar que somente brancos ou homens apareçam nos resultados. No entanto, essa abordagem tem sido criticada por, muitas vezes, deixar as imagens distantes do resultado esperado.

Seja como for, a OpenAI considera que os seus mecanismos de segurança já são competentes o suficiente para o Dall-E 2 ser liberado para todo mundo. A organização também testa uma API para permitir que a tecnologia seja usada em aplicativos ou plugins de terceiros.

Imagens geradas com as palavras bottle, keyboard, book e printer (imagem: Emerson Alecrim/Tecnoblog)
Imagens geradas com as palavras bottle, keyboard, book e printer (imagem: Emerson Alecrim/Tecnoblog)

Brinque com o Dall-E 2

Se você quiser testar a versão mais recente da tecnologia, precisa apenas criar uma conta na OpenAI e fazer login no site do Dall-E 2. Ao acessar o serviço, você recebe 50 créditos. Depois disso, mais 15 créditos são fornecidos todos os meses.

Cada crédito permite gerar uma rodada com quatro imagens, editar uma imagem já gerada (inpainting) ou estender uma imagem já criada (outpainting) para novos resultados. Se os créditos gratuitos não forem suficientes, é possível comprar mais.

Dentro do serviço, é só digitar palavras no campo principal do site e esperar pelo resultado. Para gerar as imagens logo acima, digitei alguns objetos que estavam em minha mesa: bottle (garrafa), keyboard (teclado), book (livro) e printer (impressora).

Mó brisa, né?

Receba mais sobre OpenAI na sua caixa de entrada

* ao se inscrever você aceita a nossa política de privacidade
Newsletter
Emerson Alecrim

Emerson Alecrim

Repórter

Emerson Alecrim cobre tecnologia desde 2001 e entrou para o Tecnoblog em 2013, se especializando na cobertura de temas como hardware, sistemas operacionais e negócios. Formado em ciência da computação, seguiu carreira em comunicação, sempre mantendo a tecnologia como base. Em 2022, foi reconhecido no Prêmio ESET de Segurança em Informação. Em 2023, foi reconhecido no Prêmio Especialistas, em eletroeletrônicos. Participa do Tecnocast, já passou pelo TechTudo e mantém o site Infowester.

Relacionados