IA finge que é humana e consegue derrubar os captchas do Google

Modelo resolve desafios com precisão comparável à de uma pessoa. Tecnologia do Google, no entanto, usa outros parâmetros para identificar robôs.

Giovanni Santa Rosa
• Atualizado há 2 semanas
Inteligência artificial
IA nem sempre acerta na primeira tentativa, mas desempenho é comparável ao de humanos (Imagem: Vitor Pádua / Tecnoblog)
Resumo
  • Cientistas da universidade ETH Zurich treinaram uma IA para resolver captchas do Google com taxa de sucesso similar à de humanos.
  • O estudo usou o Recaptcha v2, e a IA, baseada no modelo Yolo, identificou objetos em 14 mil fotos de paisagens urbanas.
  • A IA precisou de múltiplas tentativas para passar nos testes, demonstrando desempenho comparável ao de pessoas.
  • O Google minimiza o risco, destacando que o Recaptcha v3 analisa outros fatores, como movimentos e histórico de navegação.

Cientistas da universidade ETH Zurich, na Suíca, treinaram uma inteligência artificial para que ela conseguisse resolver os captchas do Google, que existem para determinar se quem está tentando acessar um serviço é realmente de carne e osso. Ela não chegou a demonstrar 100% de precisão na hora de resolver os desafios, mas foi capaz de superar as barreiras com as mesmas taxas de sucesso que pessoas reais.

O estudo usou o Recaptcha v2, do Google. Você já deve ter passado por ele: o teste pede para o usuário identificar semáforos, faixas de pedestre, pontes e outros itens da paisagem urbana.

Captcha com nove fotos de paisagens urbanas. Usuário deve clicar naquelas que têm carros.
Modelo treinado por pesquisadores de universidade suíça aprendeu a identificar objetos (Imagem: Reprodução / Google Cloud)

Para responder às questões, os pesquisadores treinaram um modelo de processamento de imagens chamado Yolo (sigla para “you only live once”, ou “você só vive uma vez”). O treinamento usou 14 mil fotos de ruas devidamente etiquetadas. Também é importante notar que o modelo não funciona sozinho, precisando de intervenção humana para operar.

Pouco tempo depois, o Yolo conseguia reconhecer os objetos tão bem quanto um humano. Ao cometer algum erro pequeno, o Recaptcha v2 liberava mais um puzzle. Assim, com mais de uma tentativa, a IA sempre conseguia convencer o sistema de que era uma pessoa real.

Google diz que IA não põe sistema em risco

Não é a primeira vez que um sistema computadorizado consegue se sair bem na hora de resolver captchas. Há dez anos, este mesmo Tecnoblog noticiava que um software dava a resposta certa em 90% das tentativas, e existiam até serviços que empregavam humanos para passar pelos testes.

Especialistas consultados pela reportagem do Decrypt consideram que as máquinas estão cada vez melhores em resolver estes desafios. Chegará um momento em que eles não serão mais suficientes para determinar se tem um humano por trás daquele acesso.

Mesmo assim, o Google considera que risco não é tão grande quanto parece e tem seus motivos para acreditar nisso: o Recaptcha vai além dos captchas.

“Nós nos concentramos em ajudar nossos clientes a proteger seus usuários sem precisar de desafios visuais”, explica à New Scientist um representante do Google Cloud. “Hoje, a maioria das proteções oferecidas pelo Recaptcha a 7 milhões de sites é completamente invisível.”

A versão 3 da tecnologia do Google consegue analisar se um visitante é humano ou robô levando em consideração a atividade na página. É por isso que, às vezes, você clica na caixinha “Não sou um robô” e o teste nem aparece.

Marca "G" do Google
Google é responsável pela tecnologia do Recaptcha (Ilustração: Vitor Pádua/Tecnoblog)

O material da ETH Zurich leva estes aspectos em consideração. Os cientistas descobriram que o Recaptcha mostra menos captchas quando detecta movimento do mouse ou a existência de histórico e cookies no navegador, pois estes são indícios de que uma pessoa realmente está usando o computador.

Em outro teste, eles concluíram que o uso de VPN para mudar o IP também reduz o número de desafios exigidos. O sistema considera que muitos acessos consecutivos de um mesmo IP significam um comportamento automatizado.

Por isso, os testes foram realizados usando VPN, simulação de movimento do mouse e um navegador com histórico de navegação e cookies. Essas precauções foram tomadas porque o objetivo dos pesquisadores era analisar apenas a capacidade da IA em resolver os captchas, sem que outros comportamentos influenciassem no processo.

Captchas ajudam a treinar máquinas

Além de separar humanos de robôs, os captchas também têm outro propósito: as respostas dadas são usadas para treinar os próprios sistemas do Google, para que eles reconheçam objetos em imagens.

O Recaptcha, aliás, nasceu como um projeto da Universidade Carnegie Mellon, nos Estados Unidos, para ajudar a digitalizar livros antigos. Quando uma palavra não era reconhecida por sistemas automáticos, humanos contribuíam para identificar o que estava escrito ali.

Com informações: Decrypt, ZDNet e TechRadar

Relacionados

Escrito por

Giovanni Santa Rosa

Giovanni Santa Rosa

Repórter

Giovanni Santa Rosa é formado em jornalismo pela ECA-USP e cobre ciência e tecnologia desde 2012. Foi editor-assistente do Gizmodo Brasil e escreveu para o UOL Tilt e para o Jornal da USP. Cobriu o Snapdragon Tech Summit, em Maui (EUA), o Fórum Internacional de Software Livre, em Porto Alegre (RS), e a Campus Party, em São Paulo (SP). Atualmente, é autor no Tecnoblog.