O reCAPTCHA, tecnologia do Google que pede para você descobrir o que está escrito em uma imagem e aparece em muitos formulários de cadastro por aí, sempre foi muito visado por pessoas que ganham dinheiro desenvolvendo algoritmos que decifram o código automaticamente. Ironicamente, quem fez o algoritmo mais eficiente provavelmente foi o próprio Google, por meio do Street View.

recaptcha

Como você deve saber, o Street View consegue identificar números das casas nas ruas pelos quais os carros do Google passam. Isso permite que o Google Maps fique bastante preciso: quando você digitar “Rua do Limoeiro, 42” para procurar a casa do Cebolinha, o serviço sabe exatamente onde ela está, para não depender apenas das regras de numeração locais, que muitas vezes não são seguidas.

Você sabe o que está escrito aí? O algoritmo do Google sabe.

Você sabe o que está escrito aí? O algoritmo do Google sabe.

O algoritmo do Street View consegue identificar os números difíceis das residências nas fotos com um índice de acerto de 90%, o que é ótimo para um computador — afinal, muitas vezes, nem nós conseguimos decifrar os números quando estamos andando de carro.

O que o Google descobriu recentemente foi que, ao alimentar o algoritmo com textos distorcidos em preto e branco, o mesmo algoritmo do Street View também pode ser usado para decifrar o reCAPTCHA. Tudo isso com uma precisão de mais de 99%, um número ainda mais impressionante — eu tenho certeza que meu índice de acerto não chega nem a 80%.

Apesar disso, o Google diz que o reCAPTCHA não é falho e que os usuários não devem se preocupar com isso. A empresa afirma que, no ano passado, com base nos resultados da pesquisa, diminuiu a dependência do reCAPTCHA dos textos distorcidos, que não são suficientes para deter os algoritmos avançados, e está apostando em outras tecnologias — que o Google não explica exatamente como funcionam.

Comentários

Envie uma pergunta

Os mais notáveis

Comentários com a maior pontuação

Adriano Bitencourt

Eu estou com ódio deste recaptcha de imagens, eu simplesmente nao consigo avançar porque fica abrindo uma imagem após a outra e eu acabo desistindo de acessar as páginas que eu quero, além de algumas fotos serem de péssima qualidade e tipo os semáforos eu nunca sei se o poste conta também. Enfim, a pior coisa que inventaram foi este captcha de imagens, pena que o Google não lê isto, pois eu estou quase pagando alguem para burlar isto, pois eu não sou um robô e também não faço spam.

Deepdark
faz sentido, estamos alimentando uma AI sem saber
Anderson Luiz Mendes Matos
Desde 2006 não usamos. Nem em nosso website corporativo nem em nossos aplicativos web. E nem por isso recebemos "10k de emails". Desculpa, Charles. Isso só mostra a qualidade do seu formulário de contato e a vulnerabilidade do seu website.
Anderson Luiz Mendes Matos
A grande questão, Gabriel Simonetti, não é uma alternativa pros captchas mas uma forma de proteção que seja eficiente. Infelizmente, hoje, um grande número de webmasters reconhece captchas como uma forma de proteção eficiente especialmente porque o Google usa em seus serviços mas não são tão eficientes assim (o Google usa isso apenas como um elemento *adicional* em inúmeras camadas de proteção). Um desenvolvedor C# júnior é capaz de montar um robô que usa um serviço de quebra de captchas (captcha breaker/captcha solver) e que funcionará em qualquer website dali pra frente. Mas não existe uma resposta única, direta e simples pra sua pergunta. Infelizmente, em segurança, é quase sempre assim. Você pode tentar combinar técnicas como campos (e até captchas) ocultos, para enganar robôs a preenchê-los, quando estariam em branco se fosse um usuário legítimo (são ocultos)... Também pode usar filtros textuais, para processar o que está sendo enviado e como está sendo enviado, e tratar isso de forma a eliminar certos elementos ou criar uma política de quarentena, que é o que prevedores de email fazem ao enviar span (e falsos-positivo) para a caixa "Spam". Por mais surreal que possa parecer, HTTPS também ajuda, uma vez que muitos robôs simplesmente "pulam" websites https seja pelo custo do processamento da criptografia ou por simplesmente não implementar SSL/TLS. Mas não entenda errado. Não retiro o mérito do Google em pesquisar mais e tentar avançar o mecanismo do reCaptcha. Só que enquanto houver gente empenhada em mandar spam, haverá forma de driblar captchas, até mesmo os do Google.
Charles Benedito
então não usa e recebe 10k de emails do teu formulário de contato ˆˆ
Gabriel Simonetti
Anderson, o que você recomenda como alternativa?
Anderson Luiz Mendes Matos
Captcha não gera proteção e não deve ser usado para proteção. Nem mesmo como técnica anti-robo ele é minimamente confiável. Além de ser uma morte para usabilidade.
Van Neves
Li uma matéria que falava que os textos decifrados pelo usuários no reCaptcha ajudava a melhorar o algoritmo de digitalização de livros. De um tempo para cá vejo que reCaptacha coloca fotos de números de casas. Provavelmente estão usando os usuários para melhorar o algoritmo. Muito bacana.