Meio Bit » Mobile » Como o WhatsApp combate o spam sem ler suas mensagens

Como o WhatsApp combate o spam sem ler suas mensagens

Com uma mãozinha do aprendizado de máquina, o WhatsApp consegue identificar e banir dois milhões de contas por mês, identificadas como spammers

5 anos atrás

O WhatsApp possui um sério problema com spam: por ser um aplicativo de uso massivo, muitos usuários criam contas fantasmas com o único intuito de compartilhar correntes, boatos e fake news, o que inclusive gerou alguns problemas na última eleição no Brasil.

A divisão do Facebook responsável pelo app tem alguns métodos para combater a propagação de spam, desde a ferramenta de denúncia à recente limitação no encaminhamento de mensagens, hoje restrito a cinco contatos ou grupos (originalmente 250, depois 20). Mas o WhatsApp tem outros meios de detectar e expurgar mensagens indesejadas.

WhatsApp vs. Spam

Em uma coletiva de imprensa realizada na Índia, o engenheiro de software do WhatsApp Matt Jones explicou que alguns spammers utilizam métodos intrincados para montar suas redes de desinformação, indo de simuladores a aparelhos customizados, que utilizam vários chips SIM, para rodar várias instância do app de uma vez. O problema, um dos recursos essenciais para a privacidade dos usuários, a criptografia ponta a ponta, impede o uso do método mais direto de abordagem e identificação de spam, que é de fato ler o que as pessoas escrevem.

Ainda assim, há meios de identificar spam nem ler absolutamente nenhuma mensagem, e é importante para a companhia fazê-lo: em 2018, o aplicativo foi utilizado como "fonte de informação" que motivou uma onda de violência na Índia, que entre o mês de maio e julho culminou na morte de 27 pessoas, por conta de boatos propagados pelo WhatsApp.

Para combater o spam, o WhatApp analisa as "ações dos usuários", um conjunto de informações usados para identificar se o usuário é um humano ou um bot, e mesmo no primeiro caso, se ele está interagindo normalmente ou propagando spam. O pacote inclui os metadados das mensagens, o endereço IP, a operadora, a data de criação da conta, a localização com base no GPS e a quantidade de mensagens enviadas, especialmente levando em consideração quando a conta foi criada.

Com esses dados, o WhatsApp consegue identificar redes utilizadas para registrar muitos números de uma só vez, e é possível identificar bots e usuários corta-cola, comportamento típico de spammers, que repassam mensagens já prontas. O recurso que indica quando um contato está escrevendo uma mensagem é capaz de diferenciar neste momento o tipo de usuário, e identificar quem está de boa e quem está espalhando correntes.

Jones explicou que o WhatsApp demarcou três "limiares" principais, usados para identificar o tipo de conta do usuário: o registro de um novo número de celular na plataforma, o momento da troca de mensagens, e a denúncia de um usuário feita contra um determinado contato. Confirmada a identidade como um bot ou spammer, o picareta é banido.

Até o início de 2018, a base instalada do WhatsApp contava com 1,5 bilhão de usuários ativos mensais, logo, a quantidade de spammers identificada é proporcionalmente alta: em média, a plataforma bane dois milhões de contas por mês, sendo 75% delas através de um algoritmo, que usa aprendizado de máquina para desmascarar engraçadinhos. 20% do total são pegas logo no ato do registro, e banidas antes de enviar uma mensagem sequer. As que conseguem passar do primeiro limiar são eventualmente banidas posteriormente, com 90% identificadas através de conversas individuais, e 10% por atividades em grupos.

Há um motivo de por quê Jones escolheu a Índia para explicar esses pontos: em abril, além da onda recente de violência com o app como protagonista involuntário, o país é o maior mercado da plataforma e realizará eleições gerais em abril, assim, esta será uma excelente oportunidade para testar se seus esforços em combater o spam darão resultado.

Com informações: The Next Web.

Leia mais sobre: , .

relacionados


Comentários