Pouca gente sabe, mas boa parte do trabalho de mapeamento das ruas é feita manualmente. E muitas cidades afastadas até possuem o traçado de suas ruas no GPS, mas não os nomes das vias — já que elas precisam ser visitadas e então cadastradas por humanos. Mas o Google está conseguindo melhorar seus mapas por meio de imagens do Street View, inteligência artificial e muito poder de processamento.

O Google desenvolveu uma rede neural para extrair automaticamente nomes de ruas a partir de fotografias coletadas pelo Street View. A tecnologia já é capaz de transcrever nomes de vias francesas com precisão de 84,2%. No Brasil, o Google também está preparado para lidar com a despadronização nas nomenclaturas e nos formatos das placas.

Analisando as quatro imagens acima, um humano pode saber que existe uma avenida, e que ela se chama Presidente Castelo Branco. No entanto, a rede neural do Google teve que aprender a extrair o texto correto (há uma propaganda e placa de outra rua na mesma foto) e normalizar os nomes, transformando “AV.” em “Avenida” e “PRES.” em “Presidente”.

Há situações mais complicadas, como quando a resolução da foto não é boa o suficiente. Mesmo um humano que enxerga teria dificuldades para nomear esta avenida francesa:

É Avenue des Erables, caro membro de raça inferior

Com a rede neural e as imagens do Street View, o Google pode criar mapas do zero, inclusive com nomes de ruas que até então eram desconhecidas pelo Maps. Além disso, como você sabe, o Street View consegue identificar números de casas e prédios, o que também contribui para aumentar a precisão dos mapas: mais de 90% dos endereços no Brasil foram melhorados pelo Google por meio da tecnologia.

O interessante é que a rede neural também aprendeu a extrair informações de fachadas de estabelecimentos (e você certamente foi um bom professor marcando as fotos certas no reCaptcha). A partir das imagens do Street View, o Google sabe que ali existe um comércio de pneus chamado Zelina Pneus, não Bridgestone ou Firestone — mesmo sem saber a localização em que a imagem foi capturada.

Os dados já estão sendo extraídos e publicados com base nas 80 bilhões de imagens (!) do Street View, que são processadas nos Tensor Processing Unit (TPU), circuitos construídos pelo Google especificamente para tarefas de aprendizagem de máquina.

Receba mais notícias do Tecnoblog na sua caixa de entrada

* ao se inscrever você aceita a nossa política de privacidade
Newsletter
Paulo Higa

Paulo Higa

Ex-editor executivo

Paulo Higa é jornalista com MBA em Gestão pela FGV e uma década de experiência na cobertura de tecnologia. No Tecnoblog, atuou como editor-executivo e head de operações entre 2012 e 2023. Viajou para mais de 10 países para acompanhar eventos da indústria e já publicou 400 reviews de celulares, TVs e computadores. Foi coapresentador do Tecnocast e usa a desculpa de ser maratonista para testar wearables que ainda nem chegaram ao Brasil.

Canal Exclusivo

Relacionados