O Google já tem tecnologia capaz de identificar objetos ou certos tipos de detalhes em imagens. Isso é útil para ajudar o Google Photos a fazer classificação automática de fotos, por exemplo. Mas não parou por aí: a empresa anunciou um sistema de aprendizado de máquina que pode identificar objetos em vídeos.

Cloud Video Intelligence - tigre

A tecnologia é uma API chamada Cloud Video Intelligence. Por ora, ela está disponível como beta apenas para um grupo fechado de desenvolvedores. Esse é um sinal óbvio de que o sistema precisa ser lapidado antes de ser oferecido abertamente. Mesmo assim, o atual estágio é bastante convincente.

Esta é a semana em que o Google realiza a conferência Cloud Next. Fei-Fei Li, líder de inteligência artificial da plataforma Google Cloud, aproveitou o evento para mostrar a tecnologia em ação.

Quem estava no palco viu a API identificar um cachorro dachshund (raça que a gente costuma chamar de “salsichinha” ou “cofap” no Brasil) e, logo depois, entender que aquele vídeo é um comercial de TV. A demonstração seguinte foi tão ou mais impressionante: como resposta a uma busca por “praia”, a tecnologia conseguiu localizar vídeos com cenas desse tipo de lugar.

Se você buscar por “praia” no YouTube, certamente encontrará vídeos relacionados ao assunto. Mas o serviço utiliza prioritariamente palavras-chave, tags e descrições dadas pelos usuários para classificar o conteúdo. A Cloud Video Intelligence consegue fazer um trabalho equivalente, mas sozinha, sem depender de auxílio humano.

Google just showed off a new Video Intelligence API that lets you search for objects within video clips, here’s an bit of the demo pic.twitter.com/wOPwsmnAfe

— Karissa Bell (@karissabe) March 8, 2017

Segundo Li, a Cloud Video Intelligence foi desenvolvida com base em frameworks como TensorFlow e, depois, submetida a uma base de dados em grande escala: o YouTube, lógico. Os processos não foram explicados com detalhes, mas, com a análise dos vídeos, o algoritmo aprende a distinguir objetos, entidades (animais, pessoas, flores, etc.) e ações (nadar, voar, navegar, entre outros). A tecnologia também é capaz de contextualizar: uma busca por tigre também mostra conteúdo relacionado, como vida selvagem, zoológico e gatos.

Na conferência Cloud Next, o Google se esforçou bastante para deixar claro que é um player sério em aplicações baseadas nas nuvens e em inteligência artificial. Nesse sentido, a API Cloud Video Intelligence aparece como parte dos vários recursos da plataforma Google Cloud.

Eu não vou estranhar se o Google aproveitar essa tecnologia no YouTube, mas, pelo menos na fase inicial, a API será disponibilizada apenas para as organizações que utilizam o serviço Google Cloud Storage (entre elas estão empresas como Evernote e Spotify).

Com informações: Mashable

Relacionados

Escrito por

Emerson Alecrim

Emerson Alecrim

Repórter

Emerson Alecrim cobre tecnologia desde 2001 e entrou para o Tecnoblog em 2013, se especializando na cobertura de temas como hardware, sistemas operacionais e negócios. Formado em ciência da computação, seguiu carreira em comunicação, sempre mantendo a tecnologia como base. Em 2022, foi reconhecido no Prêmio ESET de Segurança em Informação. Em 2023, foi reconhecido no Prêmio Especialistas, em eletroeletrônicos. Participa do Tecnocast, já passou pelo TechTudo e mantém o site Infowester.