Início » Aplicativos e Software » Project Adam, da Microsoft, promete reconhecer e classificar objetos em imagens com precisão

Project Adam, da Microsoft, promete reconhecer e classificar objetos em imagens com precisão

Emerson Alecrim Por

Você vê um pássaro passeando pelo seu jardim, mas não sabe a qual espécie ele pertence. O que você faz? Tira o smartphone do bolso, aponta a câmera do dispositivo para o animal e aguarda a resposta, simples assim. Ok, parece bom demais para ser verdade, mas a Microsoft Research está trabalhando em um projeto de inteligência artificial chamado Adam que pode tornar funcionalidades como esta reais.

Buscas baseadas em fotos não são novidade. O próprio Google já suporta este tipo de pesquisa há tempos (vá ao Google Imagens e clique no ícone da câmera no campo de busca para testá-la, se você nunca o fez). Só que nenhum dos sistemas atuais é desenvolvido o suficiente para ser utilizado em larga escala.

Project Adam - reconhecimento de imagem

Com o Project Adam, a Microsoft tenta avançar um passo gigantesco em relação às técnicas de reconhecimento de imagens atuais. A ideia não é apenas identificar objetos, ambientes e afins, mas também classificar e contextualizar as informações capturadas.

Em outras palavras, não basta reconhecer um cachorro em uma foto, é importante que se saiba a qual raça o animal pertence; de igual forma, não é suficiente informar que há uma escultura na imagem, mas quem é o seu autor e qual o nome da obra.

A Microsoft explica que este tipo de tecnologia poderá ter uma série de utilidades. Quando o usuário tirar a foto de um prato, por exemplo, o sistema será capaz de identificar cada alimento presente e estimar a quantidade de calorias existente ali ou informar as suas propriedades nutricionais.

Sem fazer muito esforço, nós mesmos já podemos encontrar outras aplicações: se você estiver na frente de um cinema, pode apontar o smartphone para o cartaz de um filme para saber se vale a pena assistí-lo, por exemplo.

Sendo este um projeto de inteligência artificial, você já deve ser sacado o "segredo": o Adam utiliza um sistema de redes neurais para aprender a reconhecer padrões com o passar do tempo, tal como o faz o cérebro humano.

Mais precisamente, o Project Adam utiliza uma técnica algorítmica chamada "Deep Learning" (Aprendizagem Profunda) que analisa em níveis uma série de dados para aprender a distinguir padrões.

A Microsoft entende que o sucesso do projeto depende não só da sua precisão na identificação de imagens, como também do tempo de resposta e de sua escalabilidade. É um tanto quanto óbvio: se o Adam for uma futura função do Windows Phone, por exemplo, é necessário apresentar resultados de maneira rápida ao usuário e suportar uma grande quantidade de consultas simultâneas.

Para tanto, além de apostar em uma estrutura baseada nas nuvens, a Microsoft está implementando uma técnica assíncrona de análise de imagens. Isso significa que o sistema será capaz de dividir a carga de processamento em vários blocos e fazer com que cada parte seja executada de maneira independente da outra.

Graças a isso, o Project Adam conseguirá ser até 50 vezes mais rápido que sistemas de reconhecimento de imagem atuais e apresentar resultados duas vezes mais precisos, segundo os pesquisadores envolvidos com a iniciativa.

Na primeira fase, a Microsoft Research está preocupada justamente em fazer com que o Project Adam seja eficiente no reconhecimento. Para ser treinado, o sistema conta com uma base inicial de 14 milhões de imagens divididas em 22 mil categorias.

Na etapa seguinte, a empresa pretende aperfeiçoar a contextualização. Assim, o Adam poderá responder a perguntas relacionadas a uma foto, por exemplo. Sim, isso significa que, dependendo de seu sucesso, o Adam poderá até ser incorporado à assistente de voz Cortana. Só não sabemos quando: a própria Microsoft reconhece que a iniciativa está em fase bastante embrionária.

Com informações: Wired

Comentários

Envie uma pergunta

Os mais notáveis

Comentários com a maior pontuação

Marcos Dias Meneghel
Ninguém lembrou do Google Goggles, né? :/ Ele é bem parecido. u.u
Andre Francisco
Ronaldo Soares Pego É só não perder o celular no fundo mar, miguxo. E parar com as dorga.
RamonGonz
muito interessante tudo que envolve esse projeto... espero mesmo que saia do papel. e será que ninguem pensou na utilidade na área da segurança?
Ronaldo Soares Pego
Por que as plantas não possuem um cérebro? Porque ela não precisam se locomover no espaço! O reconhecimento de imagens é efeito colateral da necessidade de se locomover no espaço. uma evidencia disso é o tunicado, você já ouviu falar sobre ele? O tunicado pertence ao grupo dos animais marinhos. Ao nascer, ele nada livremente, porém, na passagem da fase jovem para a adulta, se fixa numa pedra. A partir daí, esse animal digere o próprio cérebro. Por isso acho que esse programa vai ser frustrante.
Vitor Gabriel
Alecrim, o Bing Vision já identifica cartaz de filmes, séries e de albums de músicas além de livros - mas apenas nos EUA. =P
Vitor Gabriel
Se você ver no vídeo, já tá meio que integrado à Cortana.
Lucas Wiederkehr
Microsoft é Microsoft porra! E se der certo, tomara que implementem na Cortana. Imagina: hey cortana, what is it? E vc apontar a câmera, tirar uma foto e ela detalhar certinho o que é...
Giovanni M. Gaspar
Pokedex inventada. U.u . Brincadeiras a parte, muito legal isso ai!