Drawing bot da Microsoft

Não sei quanto a você, mas se alguém me pedir para desenhar um objeto qualquer, eu não vou passar de alguns poucos esboços infantis. Um computador, porém, pode criar a imagem que lhe pedirem com riqueza de detalhes: pesquisadores da Microsoft desenvolveram um algoritmo de inteligência artificial que faz desenhos realistas a partir de uma descrição.

  • Como usar o Dollify [like a pro]

Olhando as miniaturas, a gente tem impressão de que as imagens são fotos, mas a companhia jura de pé junto que todas elas foram geradas pelo drawing bot, como o algoritmo vem sendo chamado. “Se você busca no Bing por um pássaro, receberá fotos de um pássaro. Mas, aqui, as imagens foram criadas pelo computador, pixel por pixel, desde o zero”, diz Xiaodong He, um dos pesquisadores do projeto.

Tudo o que o bot precisa é de uma breve descrição do que vai ser desenhado, por exemplo, “vacas pastando no campo” ou algo mais abstrato (na nossa percepção), como “um ônibus de dois andares flutuando”. O objeto é desenhado com fundo ou entorno complementado com elementos definidos pelo próprio bot, ou seja, que não estão na descrição.

É como se o algoritmo tivesse imaginação. Mas ele não tem, não no sentido estrito da palavra. Os desenhos são gerados com base no banco de imagens usado no treinamento. É por isso que, na ausência de objetos referenciados na descrição ou com uma base de referência fraca, o bot pode acabar criando imagens bizarras, daquelas que, se feitas por uma pessoa, talvez fariam você perguntar quem é o fornecedor dela.

Drawing bot da Microsoft

A base do drawing bot é o CaptionBot, projeto de inteligência artificial criado anteriormente que gera descrições de imagens, e o SeeingAI, sistema que é capaz de narrar ou responder a perguntas sobre imagens (ele é útil para deficientes visuais, por exemplo).

Quando um desenho é criado, uma parte do bot analisa o resultado para verificar se ele corresponde com a descrição passada com auxílio de um modelo matemático que simula a atenção humana: se você sabe que a imagem tem que ter um pássaro, vai procurar um pássaro nela; o algoritmo faz a mesma coisa, ou seja, lê a descrição e tenta identificar os elementos associados às palavras.

Ainda que os resultados atuais tenham inconsistências, eles impressionam, sinalizando que, com ajustes e mais treinos, as imagens criadas poderão se aproximar da perfeição, possibilitando que o algoritmo seja usado em softwares de edição de imagens ou criação de animações.

Com informações: TechCrunch.

Receba mais sobre Microsoft na sua caixa de entrada

* ao se inscrever você aceita a nossa política de privacidade
Newsletter
Emerson Alecrim

Emerson Alecrim

Repórter

Emerson Alecrim cobre tecnologia desde 2001 e entrou para o Tecnoblog em 2013, se especializando na cobertura de temas como hardware, sistemas operacionais e negócios. Formado em ciência da computação, seguiu carreira em comunicação, sempre mantendo a tecnologia como base. Em 2022, foi reconhecido no Prêmio ESET de Segurança em Informação. Em 2023, foi reconhecido no Prêmio Especialistas, em eletroeletrônicos. Participa do Tecnocast, já passou pelo TechTudo e mantém o site Infowester.

Relacionados