Adeus, spam? Gmail está 38% melhor em pegar emails não solicitados

Ferramenta requer 200 mil parâmetros, bem mais do que os “milhões” utilizados em soluções similares. Google diz que falsos-positivos foram menores.

Thássius Veloso
Por
Gmail faz 20 anos: como o serviço mudou o e-mail ao oferecer 1 GB de espaço (imagem: Vitor Pádua/Tecnoblog)
RETVec está em teste no Gmail há um ano (Imagem: Vitor Pádua/Tecnoblog)

O incômodo causado pelo spam e pelos golpes pode estar com os dias contados no Gmail graças a uma nova tecnologia desenvolvida pelo Google. Apelidada de RETVec, a ferramenta de análise de texto se mostrou eficiente em detectar problemas em mensagens de email em mais de 100 idiomas.

De acordo com o Google, houve uma melhoria de 38% na detecção de spam ao mesmo tempo em que o RETVec exige menos recursos computacionais. Por exemplo, a latência nas tarefas de classificação de mensagens diminuiu 30% ao longo do último ano.

Tabela
Tabela com alguns dos resultados obtidos pelo RETVec no Gmail (Imagem: Divulgação/Google)

Também houve uma redução de 19,4% nos falsos-positivos, ou seja, quando um email legítimo cai na caixa de spam do Gmail.

Os cientistas por trás da ferramenta publicaram uma série de ilustrações que mostram o funcionamento do Resilient & Efficient Text Vectorizer do ponto de vista técnico. Em resumo, a tecnologia é mais eficiente em detectar caracteres errados, usos de homoglifos (letras parecidas) e outras técnicas usadas pelos spammers para enganar sistemas de email.

O RETVec não precisa de adaptações para operar nos mais de 100 idiomas. Ele funciona com todos os caracteres previstos na codificação UTF-8, a mais utilizada por sistemas eletrônicos hoje em dia. De acordo com o Google, é possível implementá-lo tanto em servidores online quanto nos aplicativos de smartphone (para processamento local).

A aplicação é bem menor do que soluções similares: ela trabalha com 200 mil parâmetros, em vez de “milhões” que são usados por mecanismos similares. O projeto do RETVec foi publicado no GitHub para quem quiser utilizar.

Com informações: Google, RETVec (no GitHub), 9to5 Google e Android Headlines

Relacionados