Início » Inteligência Artificial » IA da Microsoft cria desenhos realistas a partir de descrições

IA da Microsoft cria desenhos realistas a partir de descrições

Emerson Alecrim Por

Não sei quanto a você, mas se alguém me pedir para desenhar um objeto qualquer, eu não vou passar de alguns poucos esboços infantis. Um computador, porém, pode criar a imagem que lhe pedirem com riqueza de detalhes: pesquisadores da Microsoft desenvolveram um algoritmo de inteligência artificial que faz desenhos realistas a partir de uma descrição.

Drawing bot da Microsoft

Olhando as miniaturas, a gente tem impressão de que as imagens são fotos, mas a companhia jura de pé junto que todas elas foram geradas pelo drawing bot, como o algoritmo vem sendo chamado. "Se você busca no Bing por um pássaro, receberá fotos de um pássaro. Mas, aqui, as imagens foram criadas pelo computador, pixel por pixel, desde o zero", diz Xiaodong He, um dos pesquisadores do projeto.

Tudo o que o bot precisa é de uma breve descrição do que vai ser desenhado, por exemplo, "vacas pastando no campo" ou algo mais abstrato (na nossa percepção), como "um ônibus de dois andares flutuando". O objeto é desenhado com fundo ou entorno complementado com elementos definidos pelo próprio bot, ou seja, que não estão na descrição.

É como se o algoritmo tivesse imaginação. Mas ele não tem, não no sentido estrito da palavra. Os desenhos são gerados com base no banco de imagens usado no treinamento. É por isso que, na ausência de objetos referenciados na descrição ou com uma base de referência fraca, o bot pode acabar criando imagens bizarras, daquelas que, se feitas por uma pessoa, talvez fariam você perguntar quem é o fornecedor dela.

Drawing bot da Microsoft

A base do drawing bot é o CaptionBot, projeto de inteligência artificial criado anteriormente que gera descrições de imagens, e o SeeingAI, sistema que é capaz de narrar ou responder a perguntas sobre imagens (ele é útil para deficientes visuais, por exemplo).

Quando um desenho é criado, uma parte do bot analisa o resultado para verificar se ele corresponde com a descrição passada com auxílio de um modelo matemático que simula a atenção humana: se você sabe que a imagem tem que ter um pássaro, vai procurar um pássaro nela; o algoritmo faz a mesma coisa, ou seja, lê a descrição e tenta identificar os elementos associados às palavras.

Ainda que os resultados atuais tenham inconsistências, eles impressionam, sinalizando que, com ajustes e mais treinos, as imagens criadas poderão se aproximar da perfeição, possibilitando que o algoritmo seja usado em softwares de edição de imagens ou criação de animações.

Com informações: TechCrunch.

Mitos e verdades sobre a IA

Existe uma certa afobação na comunidade em torno da Inteligência Artificial. E isso tem acontecido principalmente porque a ideia de máquinas inteligentes gera muita mídia, além de ser um prato cheio para filmes e séries de ficção científica.

Mas a IA ainda está longe de se tornar um ser autônomo, que pensa como um ser humano. O que temos hoje são várias IAs restritas, desenvolvidas para tarefas específicas. Esse é o tema do Tecnocast 064. Dá o play e vem com a gente!

Comentários

Envie uma pergunta

Os mais notáveis

Comentários com a maior pontuação

Kang Otro ✓
Você deve ser novo nos comentários.
Kang Otro ?
Você deve ser novo nos comentários.
Renan Araújo
“Say no more”
Helmut
"Desenha um arco-iru"
Uziel Almeida Oliveira
O quê o Telegram tem haver com Hinode, Nubank e Tim Beta?
Essa piada foi brisada pra caraca!
Fagner Ribeiro
cara, isso é muito Black Mirror
ʞǝʌǝɥs
pô que chato, quer dizer então que o grafeno saiu de moda ?
Jose X.
pô que chato, quer dizer então que o grafeno saiu de moda ?
ばか
Nada, iria bugar o espaço-tempo.Mas se adicionar blockchain pode ser que se crie a 4° dimensão.
Git Gud
Nada, iria bugar o espaço-tempo.
Mas se adicionar blockchain pode ser que se crie a 4° dimensão.
Anthony Toniolli
... acho que já temos a melhor resposta do ano...
Kang Otro ✓
Ia sair a cara dos investidores de bitcoin.
Kang Otro ?
Ia sair a cara dos investidores de bitcoin.
André G
Como será que ficaria o desenho se eu escrevesse:
Tim Beta; Nubank; Xiaomi; Telegram; Hinode