Início » Inteligência Artificial » Facebook cria inteligência artificial que derrota profissionais no pôquer

Facebook cria inteligência artificial que derrota profissionais no pôquer

O robô Pluribus superou dois profissionais do pôquer em partidas mais complexas, com seis jogadores

Victor Hugo Silva Por
21 semanas atrás

A inteligência artificial já vence humanos em jogos como xadrez, Go e StarCraft, mas tinha no pôquer um de seus maiores obstáculos. Não tem mais. Isso porque uma IA desenvolvida por pesquisadores do Facebook e da Universidade Carnegie Mellon conseguiu superar campeões da modalidade.

Os jogadores profissionais de pôquer, Darren Elias e Chris Ferguson, perderam para o Pluribus, como o robô é chamado. Cada um deles disputou uma partida de seis jogadores pela internet, sendo que os outros cinco eram cópias da inteligência artificial.

O Pluribus venceu com certa folga após 5 mil rodadas e se tornou o primeiro a vencer profissionais no estilo Texas Hold'em, em que não há limite de apostas. A inteligência artificial também venceu em partidas com 10 mil rodadas em que jogou contra cinco humanos.

Um dos criadores do Pluribus é Noam Brown, pesquisador do laboratório de inteligência artificial do Facebook. Ele também é o responsável pelo Libratus, que, em 2017, conseguiu vencer humanos no pôquer em um modelo mais simples, com dois jogadores.

Uma das dificuldades é não ter informações sobre o jogo dos adversários, o que não acontece no xadrez, por exemplo. "O objetivo é pesquisa fundamental sobre informações imperfeitas e sistemas multiagentes de larga escala", disse Brown à Wired.

Segundo o pesquisador, os conceitos do Pluribus poderão servir, no futuro, para carros autônomos se anteciparem às ações de outros motoristas no trânsito ou para melhorar os algoritmos de detecção de fraude.

Brown desenvolveu o robô com Tuomas Sandholm, professor na Universidade Carnegie Mellon, que já tem acordo com duas empresas para levar as técnicas ao mercado. O Pluribus é mais complexo que o Libratus por fazer projeções melhores sobre os resultados de suas ações.

A experiência anterior buscava mapear todas as consequências possíveis até o final do jogo, o que seria inviável em uma partida com seis pessoas. Os pesquisadores decidiram, então, analisar apenas algumas jogadas a frente e considerar eventuais mudanças de estratégias dos adversários.

O Pluribus levou oito dias de treino para dominar o pôquer. A tarefa, segundo Brown, poderia ser feita com um investimento de US$ 150 em um serviço de computação em nuvem. O Libratus, por sua vez, precisou de dois meses de treino e custaria US$ 1 milhão para atingir o feito do novo robô.

Com o objetivo alcançado, Brown não pretende usar o Pluribus para ganhar dinheiro no pôquer. "Não vamos divulgar o código, em parte porque isso teria um grande impacto na comunidade do pôquer online", disse. "Estamos tentando tornar isso visível a pessoas da comunidade de inteligência artificial e não a pessoas que querem fazer IAs de pôquer".