Início » Ciência » Google mostra tecnologia capaz de "legendar" fotos

Google mostra tecnologia capaz de "legendar" fotos

Emerson Alecrim Por

Há tempos que desenvolvedores do Google trabalham em tecnologias de reconhecimento e interpretação de imagens. Uma destas frentes de pesquisa foi apresentada recentemente pela companhia: trata-se de um sistema que é capaz de reconhecer objetos e, tanto quanto possível, descrever cenários em fotos.

É um diferencial e tanto porque os algoritmos atuais não vão muito longe na contextualização das imagens. O sistema do Google, no entanto, consegue "legendar" as imagens fazendo uma associação entre os elementos identificados.

No exemplo abaixo, o sistema forneceu a seguinte descrição: "two pizzas sitting on top of a stove top oven", em tradução livre, algo como "duas pizzas colocadas em cima de um fogão".

Google: two pizzas sitting on top of a stove top oven

As descrições, às vezes, são redundantes ou falhas na identificação de uma característica ou outra. Em uma das imagens, o software descreveu "dois cachorros brincando na grama", mas a foto mostra três.

De qualquer forma, são imperfeições que podem ser amenizadas com o tempo. Como talvez você tenha presumido, esta tecnologia é baseada em redes neurais artificiais, portanto, o sistema consegue aprender à medida que trabalha.

Google: imagens reconhecidas pela tecnologia, incluindo as erradas

Mais precisamente, a tecnologia se baseia em uma variação chamada Redes Neurais Recorrentes e, mais recentemente, em um tipo denominado Redes Neurais por Convolução, que é usada com mais frequência justamente no processamento de imagens e sinais.

Uma tecnologia como esta poderá ajudar o Google a oferecer buscas de imagens mais precisas. Mas a empresa ressalta outras aplicações relevantes, entre elas, sistemas que ajudam deficientes visuais a compreenderem o contexto de um foto.

O estudo detalhado foi publicado nesta página.

Comentários

Envie uma pergunta

Os mais notáveis

Comentários com a maior pontuação

Luandersonn Airton
Fiz um teste e só funciona no Windows
Luandersonn Airton
Mas isso já tem no OneDrive faz tempo
Gabriel Tadeu
Ficarei feliz quando nunca mais tiver que escrever um texto alternativo (atributo alt no html) para ter uma página mais acessível :)
Guest
.
Renato Moura
Isso ja ta disponível ha pelos menos alguns meses
Renato Moura
De modo menos obvio, num grau menor de dificuldade, já dá pra pesquisar por algum termo em inglês no google photos e ele busca termos indexados por reconhecimento de inteligência artificial das imagens, como... Sky, cat dog, glasses, child, people, blue, etc... Sempre palavras simples, mas já usei mto a ferramenta pra encontrar imagens dentro das minhas fotos, e é muito util.
Paulo Higa
O Google usa algumas tecnologias de reconhecimento de imagem não apenas no Google Search, mas também na ferramenta de busca do Google Drive, que é sensacional. Eu posso digitar coisas como "Sony" no Google Drive e ver fotos de smartphones da Sony que tenho guardadas lá (ele faz o reconhecimento de caracteres no logotipo). Do mesmo modo, "Anatel" me retorna algumas fotos de baterias com o selo da Anatel. :-P É uma das coisas que sinto falta no OneDrive.