Início » Inteligência Artificial » Facebook cria inteligência artificial que derrota profissionais no pôquer

Facebook cria inteligência artificial que derrota profissionais no pôquer

O robô Pluribus superou dois profissionais do pôquer em partidas mais complexas, com seis jogadores

Victor Hugo Silva Por

A inteligência artificial já vence humanos em jogos como xadrez, Go e StarCraft, mas tinha no pôquer um de seus maiores obstáculos. Não tem mais. Isso porque uma IA desenvolvida por pesquisadores do Facebook e da Universidade Carnegie Mellon conseguiu superar campeões da modalidade.

Os jogadores profissionais de pôquer, Darren Elias e Chris Ferguson, perderam para o Pluribus, como o robô é chamado. Cada um deles disputou uma partida de seis jogadores pela internet, sendo que os outros cinco eram cópias da inteligência artificial.

O Pluribus venceu com certa folga após 5 mil rodadas e se tornou o primeiro a vencer profissionais no estilo Texas Hold'em, em que não há limite de apostas. A inteligência artificial também venceu em partidas com 10 mil rodadas em que jogou contra cinco humanos.

Um dos criadores do Pluribus é Noam Brown, pesquisador do laboratório de inteligência artificial do Facebook. Ele também é o responsável pelo Libratus, que, em 2017, conseguiu vencer humanos no pôquer em um modelo mais simples, com dois jogadores.

Uma das dificuldades é não ter informações sobre o jogo dos adversários, o que não acontece no xadrez, por exemplo. "O objetivo é pesquisa fundamental sobre informações imperfeitas e sistemas multiagentes de larga escala", disse Brown à Wired.

Segundo o pesquisador, os conceitos do Pluribus poderão servir, no futuro, para carros autônomos se anteciparem às ações de outros motoristas no trânsito ou para melhorar os algoritmos de detecção de fraude.

Brown desenvolveu o robô com Tuomas Sandholm, professor na Universidade Carnegie Mellon, que já tem acordo com duas empresas para levar as técnicas ao mercado. O Pluribus é mais complexo que o Libratus por fazer projeções melhores sobre os resultados de suas ações.

A experiência anterior buscava mapear todas as consequências possíveis até o final do jogo, o que seria inviável em uma partida com seis pessoas. Os pesquisadores decidiram, então, analisar apenas algumas jogadas a frente e considerar eventuais mudanças de estratégias dos adversários.

O Pluribus levou oito dias de treino para dominar o pôquer. A tarefa, segundo Brown, poderia ser feita com um investimento de US$ 150 em um serviço de computação em nuvem. O Libratus, por sua vez, precisou de dois meses de treino e custaria US$ 1 milhão para atingir o feito do novo robô.

Com o objetivo alcançado, Brown não pretende usar o Pluribus para ganhar dinheiro no pôquer. "Não vamos divulgar o código, em parte porque isso teria um grande impacto na comunidade do pôquer online", disse. "Estamos tentando tornar isso visível a pessoas da comunidade de inteligência artificial e não a pessoas que querem fazer IAs de pôquer".

Comentários

Envie uma pergunta

Os mais notáveis

Comentários com a maior pontuação

João
Nossa, já pensou deixar isso rodando e ganhar muita grana online hahahaha.
Daniel San
https://uploads.disquscdn.c...
Mauro Moraes
Eu até poderia concordar com você, mas aí nós aumentaríamos a quantidade de pessoas falando bobeira. O contexto aqui não é "computador vence jogador humano de poker". A ideia é colocar um sistema de inteligência artificial para lidar com variáveis aleatórias em curto espaço de tempo e quais as possíveis consequências. Inclusive foram dados exemplos claros de possíveis aplicações de um sistema desses. Pro nosso cérebro é automático pensar nisso, por exemplo, no trânsito. Tem um pedestre prestes a atravessar a rua, você está numa velocidade considerável e vem outro carro logo atrás de você. Existe uma faixa de mão contrária ao seu lado, mas vem um carro lá. Ele está a uma certa distância, e não muito rápido. A faixa é contínua. Você senta o pé no freio, mesmo sabendo que vai tomar uma pancada na traseira? E ainda por cima correndo o risco de ter o seu carro arremessado contra o pedestre assim mesmo? Ou você faz uma mudança brusca, porém "segura", invadindo a faixa contrária e voltando a tempo para a sua faixa? É nesse tipo de situação que um sistema desses seria de grande valia. Analisar consequências, por mais que seja fácil para um ser humano (mesmo assim, pouquíssimos usam o cérebro pra isso. Normalmente ele está ocupado com memes), ainda é uma tarefa complexa para uma máquina!
zephyr1an
eles vão dar um jeito de aplicar um teste de Turing inverso, se você passar então você é humano :)
Luizão
nos anos 90 esse tipo de notícia até poderia ter destaque, mas hj em dia?????
johndoe1981
Rapaz, com um robôzinho desses eu ganharia uma boa grana no Pokerstars xD
Trovalds
Daqui uns dias a notícia vai ser: "sites de poquer online tem prejuízo..."
Helmut
“Não vamos divulgar o código, em parte porque isso teria um grande impacto na comunidade do pôquer online”As pessoas não precisam do código, elas só precisam saber que é viável.