RankBrain: como o Google lida com termos de pesquisa confusos ou ambíguos
Nos últimos anos, o Google evoluiu muito a precisão de seus resultados de busca, introduzindo novidades como o Knowledge Graph. A partir dele, é possível ter informações completas retiradas da internet de uma série de itens, como informações de livros, celebridades e locais. Outro exemplo é o Google Now, que aceita perguntas diretas e funciona de maneira semelhante a um assistente virtual, respondendo a perguntas objetivas como “Qual é a altura do Monte Everest?”.
E a gigante de Mountain View não para por aí. O Google tem centenas de algoritmos, incluindo o PageRank, para organizar rapidamente e com precisão os resultados de busca. Um deles (e um dos mais importantes) é o RankBrain, que lida com pesquisas que não são facilmente decifráveis por um computador (ou até por um humano).
A diferença do RankBrain em comparação com os outros algoritmos é que a maioria deles é projetada pelos engenheiros do Google baseado em coisas que eles veem ou experimentam no mundo real. Com o RankBrain é diferente: o algoritmo usa inteligência artificial para interpretar os termos de busca usando a “intuição” e aprende com o tempo.
Mas por que isso é necessário? Greg Corrado, cientista de pesquisas sênior do Google, em entrevista ao Bloomberg, disse que muitas das pesquisas feitas no Google são com termos ambíguos ou escritas em termos coloquiais, como se você estivesse falando com uma pessoa de verdade. “É aí que os computadores normalmente falham, porque eles não conseguem entender ou nunca se depararam com essa frase antes”, explica.
Essa confusão até que é compreensível: é fácil dar resultados para uma busca como “consumidor primário cadeia alimentar”, mas mais complicado para uma pergunta mais elaborada, com termos ambíguos, como “Qual é o título do consumidor que está no nível mais alto de uma cadeia alimentar?”, de acordo com o exemplo do Blooomberg.
Então, o algoritmo pode, de certa forma, generalizar a pergunta e associá-la a algum termo pesquisado no passado. Dessa forma, o resultado mostrado não será o mais preciso possível, mas já é um avanço levando em consideração o tipo de pergunta. Corrado compara a atuação do RankBrain a uma conversa em um bar lotado. “Eu não consigo ouvir exatamente o que você está dizendo, mas eu posso adivinhar o que você quer dizer e ter uma conversa com você”, diz.
Tudo bem que muita gente passa a dominar algumas técnicas de busca do Google, como usar aspas nas pesquisas para torná-la mais preicsa. Mas também tem muita gente que ainda depende desse algoritmo: cerca de 15% das milhões de pesquisas por segundo usam termos que o Google nunca viu antes.
Mas quão precisa é essa ferramenta, afinal? Bastante: alguns engenheiros de busca receberam a tarefa de analisar o que as pesquisas queriam dizer, a fim de compará-la com o RankBrain. O algoritmo acertou 80% das vezes, enquanto os engenheiros tiveram sucesso em apenas 70% dos resultados. Desabilitar esse algoritmo “seria como causar um dano aos usuários semelhante a esquecer de oferecer metade das páginas da Wikipédia”, segundo o cientista.