Desde 1952, quando um computador conseguiu dominar o jogo da velha, vemos máquinas derrotando humanos em jogos simples ou até mesmo em alguns que exigem lógica pura. Isso ganhou força mais recentemente graças à inteligência artificial que se desenvolve como nunca.

Não é à toa que um software criado pelo Google que funciona na base de aprendizado de máquina derrotou um campeão do jogo Go em um projeto. Batizado de AlphaGo, ele foi desenvolvido pelo DeepMind, laboratório da gigante de Mountain View que cria algoritmos que resolvem problemas aprendendo com as suas próprias falhas.

O jogo chinês em questão é chamado simplesmente de Go, Weiqi ou Baduk. Ele foi escolhido pela equipe do Google para testar o software por ser particularmente desafiante para computadores. O jogador precisa cercar as peças do oponente em um tabuleiro de 19×19 quadros apenas colocando as bolinhas em fileira.

Com uma área disponível tão grande, você já deve imaginar que são inúmeras as opções de jogada. E como: cada jogador tem cerca de 200 opções por vez contra cerca de 20 no xadrez. O Google calcula que são mais de 10171 posições, enquanto no xadrez o máximo encontrado é de cerca de 1050. É um número tão absurdo que supera a estimativa de átomos no universo.

Tantas opções são um desafio para computadores, enquanto humanos lidam com elas de forma mais natural. “Se você perguntar a um grande jogador de Go como ele fez determinado movimento, por vezes ele responderá que apenas pareceu certo. Um jeito de pensar nisso é que o Go é um jogo muito mais intuitivo enquanto o xadrez é baseado na lógica”, explica Demis Hassabis, integrante da equipe do DeepMind.

Para testar o software, a equipe do Google convidou Fan Hui, campeão europeu de Go que dedica sua vida ao jogo desde os 12 anos. O AlphaGo venceu por 5 a 0, um resultado impressionante. Essa é a primeira vez que um programa derrota um jogador profissional.

Mas como isso é possível?

A diferença é que o AlphaGo não funciona exatamente como os outros softwares de inteligência artificial. Estes analisam a estrutura de todas as posições possíveis, o que não é possível no Go pela dimensão das possibilidades e da necessidade de intuição.

Então o Google resolveu esse problema criando um sistema que aprende com o tempo, de certa forma. Eles combinaram duas ferramentas: o algoritmo Monte Carlo tree search (MCTS, na sigla em inglês), que toma decisões baseadas em processos já feitos; e redes neurais artificiais, que se baseiam em camadas não lineares de relação.

Movimentos possíveis em cada jogada do Go.
Movimentos possíveis em cada jogada do Go

Essas redes foram úteis para criar camadas nas quais o sistema pensa sobre o jogo. Por exemplo, uma decide o próximo movimento enquanto outra tenta prever o ganhador do jogo. Combinada com a MCTS, que baseia a tomada de decisões em aprendizagem de máquina, o Google conseguiu fazer com que o AlphaGo imitasse a intuição humana.

Mas não é o suficiente apenas imitar: ainda que 57% das vezes o sistema previa o movimento humano, o AlphaGo deveria ganhar o jogo. Com isso, ele passou por uma série de testes. Foram mais de 30 milhões de movimentos de profissionais analisados e 494 jogos com outros computadores, todos vencidos pelo software do Google.

Quando todo mundo da equipe do DeepMind achou que o AlphaGo estava pronto, eles convidaram Fan Hui para jogar (e ele perdeu de 5 a 0). O resultado surpreendeu especialistas, que estimavam uma vitória do software em um período não mais curto que dez anos (!).

É interessante observar que a máquina, de certa forma, aprendeu a dominar o jogo sozinha — como nós, humanos, fazemos com a intuição. Ela ficou mais forte com o tempo, o que é fascinante e assustador.

O próximo passo é convidar o lendário Lee Sedol, jogador de Seul que é considerado o maior competidor de Go da última década. Hassabis o descreveu como “o Roger Federer do Go”, em referência ao recordista no campeonato de tênis. A disputa acontecerá em março. Quem será que vai vencer?

Com informações: iG Tecnologia

Receba mais notícias do Tecnoblog na sua caixa de entrada

* ao se inscrever você aceita a nossa política de privacidade
Newsletter
Jean Prado

Jean Prado

Ex-autor

Jean Prado é jornalista de tecnologia e conta com certificados nas áreas de Ciência de Dados, Python e Ciências Políticas. É especialista em análise e visualização de dados, e foi autor do Tecnoblog entre 2015 e 2018. Atualmente integra a equipe do Greenpeace Brasil.

Relacionados