Google aprende a traduzir entre idiomas sem treinamento prévio
O Google Tradutor está cada vez mais impressionante. A empresa divulgou uma pesquisa na qual comprovou-se que a ferramenta agora pode realizar traduções mesmo entre idiomas que não receberam um treinamento prévio sobre aquelas palavras ou frases. Mas vamos por partes.
Um tempo atrás eu fiz um comparativo entre o Google Tradutor e o Microsoft Tradutor, focando nos idiomas inglês e português, que são os que a gente mais usa no Brasil. Lembro que uma das minhas conclusões foi que, alheio à qualidade das traduções, a plataforma do Google era mais robusta e tinha tudo para evoluir mais.
Pois é. É exatamente isso que vem acontecendo. Coloque seu monóculo e diga comigo: “Com o advento da Inteligência Artificial”…
Sem sacanagem, é impressionante o que o Google vem fazendo com sua ferramenta. O amigo Alecrim postou aqui esses dias sobre como o Google Tradutor está errando menos, ao aumentar sua, digamos, fluência nos idiomas com IA e atribuição correta de acordo com os resultados das sugestões colaborativas.
Agora o Google revelou que vem usando uma espécie de idioma interno, algo como um catálogo de palavras, frases e situações contextuais, que é independente dos idiomas “humanos”. O resultado desse processo de deep learning é que a ferramenta está conseguindo traduzir frases entre determinados idiomas, mesmo que ninguém a tenha treinado para isso.
De forma simples: se ele pode traduzir de português para inglês e de inglês para japonês, então ele pode traduzir de português diretamente para japonês e vice-versa. Com uma precisão considerada razoável.
Caramba! E como isso funciona?
Essa é uma excelente pergunta. Principalmente quando a gente avalia que o Google Tradutor já trabalha com 103 idiomas, o que daria 5.253 combinações possíveis de pares de idiomas. n(n-1)/2 explica. Agora imagine a quantidade de possíveis combinações de frases, palavras, termos e contextos que precisariam ser treinados mesmo entre cada um dos pares! O processamento disso nos métodos tradicionais levaria anos.
Nos testes feitos pelos pesquisadores, eles treinaram vários pares de idiomas, como inglês ⇒ japonês e inglês ⇒ coreano. Em seguida, se perguntaram se o sistema seria capaz de traduzir entre japonês ⇄ coreano. E para própria surpresa, a resposta foi positiva.
Na imagem abaixo podemos ver como essa linguagem interna relacionou as traduções dos idiomas diferentes. Automaticamente. Sozinha.
O mais engraçado de tudo é que, por ser uma rede neural e usar deep learning, nem os pesquisadores sabem ao certo como isso se tornou possível. A IA, de forma autônoma, relacionou os significados dos termos, em contextos diferentes, o que produziu resultados cada vez melhores. E isso só tende a melhorar ainda mais. Em um ritmo, confesso, assustador.
Eu diria para Microsoft se cuidar, mas a gente sabe muito bem que ela também está caminhando a passos largos em suas pesquisas de aprendizado de máquina. Coisa de ficção científica? Eu diria que elas se tornam cada vez mais ciência que fictícias.
Tecnocast 044 – The Next Big Thing
Desde a introdução do primeiro PC a tecnologia passou por grandes transformações. Hoje chegamos a um ponto de maturidade, no qual poucas coisas realmente empolgantes aparecem nos anúncios de grandes empresas. Porém, uma novidade está prestes a mudar radicalmente o mundo onde vivemos. Essa novidade não está sendo tratada como uma nova feature, mas sim como uma das últimas grandes invenções da humanidade.