É assim que o Google consegue identificar números de casas e prédios no Street View

Emerson Alecrim
• Atualizado há 6 meses

Talvez você já saiba, mas o Google Street View também é capaz de identificar os números das casas e demais estabelecimentos nas ruas pelas quais seus veículos passam. A “mágica” aqui é um avançado sistema de redes neurais capaz de diferenciar, por exemplo, o número predial de um telefone informado na fachada de um escritório.

A proposta das chamadas redes neurais artificiais é, em poucas palavras, permitir que os computadores possam processar dados de uma maneira bastante semelhante à forma como o cérebro humano trabalha.

No caso do Google Street View, algoritmos identificam onde há informações escritas em cada imagem capturada (assim como rostos e outros dados críticos para outras atividades) e, em seguida, analisam a sequência como um todo para então reconhecê-la, em vez de tentar identificar caractere por caractere. É mais ou menos assim que o cérebro humano age.

Ao trabalhar desta forma, os algoritmos imediatamente descartam a sequências que tenham mais de cinco dígitos, que é a quantidade máxima de caracteres utilizada para numerar casas e prédios na maioria dos países. É assim que o Google Street View consegue não se enganar com telefones em fachadas ou com preços de produtos nas vitrines de lojas, por exemplo.

Números prediais no Google Street View

O processo de aprendizagem começa, efetivamente, com a inserção manual na base de dados de uma certa quantidade de imagens “recortadas” de números residenciais e prediais devidamente identificados. As sequências com cinco caracteres ou menos identificadas pelos algoritmos são então comparadas com estes registros.

Nestas análises e comparações, o sistema encontra vários padrões que, no final das contas, se tornam aprendizado, como tamanho físico dos números, sua posição mais comum, o formato dos caracteres e assim por diante. Estes padrões mudam de região para região, daí a necessidade de inserção de uma quantidade razoável de números já identificados por humanos. O importante é que, em pouco tempo, haverá aprendizagem suficiente para que a atividade seja feita de maneira rápida e precisa.

É claro que este trabalho todo exige outros passos. Identificar corretamente os números é um deles. Uma das maneiras que o Google encontrou para fazer isso você já conhece, provavelmente: exibir capturas de números residenciais em páginas que utilizam o reCAPTCHA. Neste caso, as sequências informadas por humanos podem ser comparadas com os resultados identificados pelo computadores ou simplesmente usadas quando estes não conseguirem fazê-lo.

Segundo o Google, a eficácia deste sistema de redes neurais é de quase 98%. Estima-se que mais de 100 milhões de números prediais já tenham sido identificados no Google Street View desde que o serviço surgiu, uma quantidade que levaria muito mais tempo se fosse feita apenas por equipes humanas.

Com informações: MIT Technology Review

Relacionados

Escrito por

Emerson Alecrim

Emerson Alecrim

Repórter

Emerson Alecrim cobre tecnologia desde 2001 e entrou para o Tecnoblog em 2013, se especializando na cobertura de temas como hardware, sistemas operacionais e negócios. Formado em ciência da computação, seguiu carreira em comunicação, sempre mantendo a tecnologia como base. Em 2022, foi reconhecido no Prêmio ESET de Segurança em Informação. Em 2023, foi reconhecido no Prêmio Especialistas, em eletroeletrônicos. Participa do Tecnocast, já passou pelo TechTudo e mantém o site Infowester.