IAs da Alibaba e Microsoft superam humanos em teste de leitura
Em um futuro não muito longe, você vai conseguir esclarecer qualquer dúvida nos serviços online da Alibaba simplesmente interagindo com um chatbot. Pelo menos é o que a gente pode imaginar com o mais recente avanço do grupo chinês: um sistema de inteligência artificial da Alibaba conseguiu vencer os humanos em um teste de compreensão de textos. Um algoritmo da Microsoft também.
O teste em questão é conhecido como SQuAD (Stanford Question Answering Dataset) e corresponde a uma base de dados com mais de 100 mil perguntas e respostas baseadas em cerca de 500 textos da Wikipedia. Esse é um dos testes de leitura e compreensão mais respeitados do mundo, tanto que é usado por gigantes de tecnologia do mundo todo.
Baseado em redes neurais profundas, o algoritmo de inteligência artificial da Alibaba conseguiu, no último dia 5, alcançar 82,440 pontos (de 100) no teste, superando os humanos: o máximo que uma pessoa real já obteve foram 82,304 pontos.
Dois dias antes, um algoritmo de inteligência artificial da Microsoft já havia conseguido superar os humanos no teste: foram 82,650 pontos. No atual ranking do SQuAD, Alibaba e Microsoft estão tecnicamente empatadas no primeiro lugar, consequentemente.
A Alibaba pretende usar a capacidade de leitura da sua inteligência artificial para gerar respostas precisas e automáticas às interações dos usuários dos seus serviços em chats, emails e afins. Mas o grupo também vê valor comercial na tecnologia: ela pode ser usada para esclarecer dúvidas em sites de serviços de saúde ou explicar acervos de museus, por exemplo.
Já a Microsoft acredita que o algoritmo vai ajudar nas interações com o Bing e a assistente Cortana, mas também vê a tecnologia sendo empregada para resolver problemas específicos, como ajudar advogados ou médicos a encontrar informações complexas em grandes manuais.
Mas isso não quer dizer que a inteligência artificial já consegue ser efetivamente melhor que os humanos na leitura e interpretação de textos. Apesar dos avanços, a capacidade dos sistemas de interpretar contexto ou lidar com ambiguidade, por exemplo, ainda é muito limitada.
Com informações: Bloomberg.