Desde 1952, quando um computador conseguiu dominar o jogo da velha, vemos máquinas derrotando humanos em jogos simples ou até mesmo em alguns que exigem lógica pura. Isso ganhou força mais recentemente graças à inteligência artificial que se desenvolve como nunca.

Não é à toa que um software criado pelo Google que funciona na base de aprendizado de máquina derrotou um campeão do jogo Go em um projeto. Batizado de AlphaGo, ele foi desenvolvido pelo DeepMind, laboratório da gigante de Mountain View que cria algoritmos que resolvem problemas aprendendo com as suas próprias falhas.

go-jogo-ai

O jogo chinês em questão é chamado simplesmente de Go, Weiqi ou Baduk. Ele foi escolhido pela equipe do Google para testar o software por ser particularmente desafiante para computadores. O jogador precisa cercar as peças do oponente em um tabuleiro de 19×19 quadros apenas colocando as bolinhas em fileira.

Com uma área disponível tão grande, você já deve imaginar que são inúmeras as opções de jogada. E como: cada jogador tem cerca de 200 opções por vez contra cerca de 20 no xadrez. O Google calcula que são mais de 10171 posições, enquanto no xadrez o máximo encontrado é de cerca de 1050. É um número tão absurdo que supera a estimativa de átomos no universo.

Tantas opções são um desafio para computadores, enquanto humanos lidam com elas de forma mais natural. “Se você perguntar a um grande jogador de Go como ele fez determinado movimento, por vezes ele responderá que apenas pareceu certo. Um jeito de pensar nisso é que o Go é um jogo muito mais intuitivo enquanto o xadrez é baseado na lógica”, explica Demis Hassabis, integrante da equipe do DeepMind.

Para testar o software, a equipe do Google convidou Fan Hui, campeão europeu de Go que dedica sua vida ao jogo desde os 12 anos. O AlphaGo venceu por 5 a 0, um resultado impressionante. Essa é a primeira vez que um programa derrota um jogador profissional.

Mas como isso é possível?

A diferença é que o AlphaGo não funciona exatamente como os outros softwares de inteligência artificial. Estes analisam a estrutura de todas as posições possíveis, o que não é possível no Go pela dimensão das possibilidades e da necessidade de intuição.

Então o Google resolveu esse problema criando um sistema que aprende com o tempo, de certa forma. Eles combinaram duas ferramentas: o algoritmo Monte Carlo tree search (MCTS, na sigla em inglês), que toma decisões baseadas em processos já feitos; e redes neurais artificiais, que se baseiam em camadas não lineares de relação.

Movimentos possíveis em cada jogada do Go.

Movimentos possíveis em cada jogada do Go

Essas redes foram úteis para criar camadas nas quais o sistema pensa sobre o jogo. Por exemplo, uma decide o próximo movimento enquanto outra tenta prever o ganhador do jogo. Combinada com a MCTS, que baseia a tomada de decisões em aprendizagem de máquina, o Google conseguiu fazer com que o AlphaGo imitasse a intuição humana.

Mas não é o suficiente apenas imitar: ainda que 57% das vezes o sistema previa o movimento humano, o AlphaGo deveria ganhar o jogo. Com isso, ele passou por uma série de testes. Foram mais de 30 milhões de movimentos de profissionais analisados e 494 jogos com outros computadores, todos vencidos pelo software do Google.

Quando todo mundo da equipe do DeepMind achou que o AlphaGo estava pronto, eles convidaram Fan Hui para jogar (e ele perdeu de 5 a 0). O resultado surpreendeu especialistas, que estimavam uma vitória do software em um período não mais curto que dez anos (!).

É interessante observar que a máquina, de certa forma, aprendeu a dominar o jogo sozinha — como nós, humanos, fazemos com a intuição. Ela ficou mais forte com o tempo, o que é fascinante e assustador.

O próximo passo é convidar o lendário Lee Sedol, jogador de Seul que é considerado o maior competidor de Go da última década. Hassabis o descreveu como “o Roger Federer do Go”, em referência ao recordista no campeonato de tênis. A disputa acontecerá em março. Quem será que vai vencer?

Com informações: iG Tecnologia

Comentários

Envie uma pergunta

Os mais notáveis

Comentários com a maior pontuação

Jônatas (JHOL)
Go é um jogo de Origem Chinesa você pode ter mais informações http://www.abrago.org/
Will

Pelo que entendi estão mudando de servidor.

Isso também me incomoda, pois não entro no site para ver as notícias, espero o feed...e pra você ver, olha a data que estou lendo essa matéria!

Weller Santibanez
Pelo que entendi estão mudando de servidor. Isso também me incomoda, pois não entro no site para ver as notícias, espero o feed...e pra você ver, olha a data que estou lendo essa matéria!
Ed
Mesmo no xadrez, os software não trabalham simulando todas as possibilidades. As combinações são absurdamente menos numerosas que no Go, mas ainda assim são inviáveis computacionalmente. Os software possuem um certo aprendizado, e trabalham com diversas heurísticas para estimar um score para os movimentos possíveis, onde movimentos com scores ruins já são descartados da simulação de lances seguintes. Dada uma configuração qualquer das peças durante o jogo, na grande maioria das vezes pelo menos metade dos movimentos possíveis são ruins, e portanto descartados logo de cara. Pegando o exemplo do 1º movimento do jogo, há 20 possibilidades, mas só umas 5 são boas, e umas outras 5 são "meh", o restante são todas ruins.
HomeroGamer-BanidodoMB

Claro, enquanto no xadrez temos 10⁵⁰ combinações no Go temos 10¹⁷¹. Não é o triplo de combinações e sim 121 zeros a mais de combinações. Uma quantidade tão absurda de combinações que (até mesmo citado na matéria) seria maior que a quantidade estimada de átomos no universo. Ou seja uma máquina com simulação de combinações (ao contrário de aprendizado) teria que ser capaz de simular o universo.

Homero Gamer
Claro, enquanto no xadrez temos 10?? combinações no Go temos 10¹?¹. Não é o triplo de combinações e sim 121 zeros a mais de combinações. Uma quantidade tão absurda de combinações que (até mesmo citado na matéria) seria maior que a quantidade estimada de átomos no universo. Ou seja uma máquina com simulação de combinações (ao contrário de aprendizado) teria que ser capaz de simular o universo.
Leonardo Caldas
Acho este tipo de notícia ao mesmo tempo fascinante e amedrontador.
Keaton
Ow, quando vocês vão arrumar o RSS? Faz séculos que o feed do Tecnoblog não atualiza no FeedBurner. (será que é bug no feedburner?)
Trovalds
Parecido, mas uma versão maior.
Diogo

Esse jogo não é o Reversi (ou Othelo, dependendo da fabricante)?

Diogo Nóbrega
Esse jogo não é o Reversi (ou Othelo, dependendo da fabricante)?
Ed
Nem sei como se joga Go, mas no universo do xadrez já não existe mais disputa entre grandes mestres humanos e os melhores software. O computador ganha (ou pelo menos empata) na grande maioria das vezes, embora vez por outra alguém ainda consiga vencer o computador.