Início » Ciência » Google Translatotron traduz e imita sua voz

Google Translatotron traduz e imita sua voz

Tecnologia do Google não precisa de conversão para texto e preserva características da voz

Paulo Higa Por

Quase todos os tradutores de voz funcionam da mesma forma: eles convertem sua fala para texto, traduzem o texto e depois sintetizam o texto traduzido em uma nova voz. O Google anunciou nesta quarta-feira (15) o Translatotron, que elimina a fase intermediária e traduz de voz para voz. Não apenas isso: ele também é capaz de preservar as características da voz original.

Google Tradutor (Foto: Wikimedia Commons)

O Translatotron (quero ver você falar isso rápido três vezes) é o nome que o Google deu para um novo sistema experimental capaz de fazer “tradução direta de fala para fala sem depender de representação intermediária em texto”. Em resumo, ele usa como fonte os espectrogramas originais e então gera espectrogramas traduzidos na linguagem definida.

Segundo o Google, “esse sistema evita dividir a tarefa em estágios separados, fornecendo algumas vantagens sobre sistemas em cascata, incluindo velocidade de inferência mais rápida, evitando naturalmente erros de composição entre reconhecimento e tradução, facilitando a retenção da voz do falante original após a tradução e lidando melhor com palavras que não precisam ser traduzidas”.

E quão bom é o Translatotron?

Neste primeiro exemplo, fica claro como ele é melhor que um sistema em cascata especialmente quando há nomes próprios. Esta é a fala original, em espanhol:

O sistema baseado em texto traduziu o nome Guillermo para William (o que obviamente não era a intenção):

Já o Translatotron fez a tradução correta, inclusive preservando o “ahn”:

As traduções acima foram realizadas apenas com um vocoder neural, que pode analisar e sintetizar uma voz humana. Mas também é possível adicionar um módulo que o Google chama de codificador de falante: ele “mantém as características da voz do falante na fala traduzida sintetizada”. As duas partes podem funcionar em conjunto, trabalhando apenas com ondas sonoras, sem texto envolvido.

O resultado não é perfeito, mas é mais familiar que no método tradicional. Esta é a fala original em espanhol:

Aqui temos a tradução já com o Translatotron, mas utilizando apenas uma voz padrão:

E esta é a tradução imitando a voz original (o Google explica que este modelo foi treinado com menos dados, por isso a tradução é um pouco diferente da anterior):

O Translatotron é apenas um experimento por enquanto, mas não é difícil imaginar que ele seja utilizado em algum produto do Google no futuro, como o Google Tradutor. Os detalhes da pesquisa podem ser encontrados nesta página.

Comentários

Envie uma pergunta

Os mais notáveis

Comentários com a maior pontuação

FastSloth87

Isso acabaria com o mercado de dublagem!

🧙‍♂️ Mago Erudito® ᴾᴿᴱᴹᴵᵁᴹ

O dia que tivermos um tradutor universal a la Guia do Mochileiro será ótimo!

Felipe Ventura

O problema devia estar no Firefox, não no Google. Eu atualizei o navegador ontem, e hoje carreguei esta página do TB e a página do Google Research; agora todos os áudios estão funcionando.

Lembre que até o Microsoft Edge antigo (sem Chromium) carregou os áudios corretamente. Fora que não há nada de proprietário no código: trata-se de HTML5 padrão com a tag <audio> e arquivos .wav. O Firefox tem suporte integrado a esse formato de áudio: https://support.mozilla.org...

davi koscianski vidal

Mas o Google não está formando um monopólio em navegadores...
O Google não está repetindo os mesmos erros que a Microsoft com o IE6.

Blind

concordo, e tempo em videos do youtube da própria empresa, já teremos as legendas que vão ser automáticas e o mais fiel possivel, só nisso já acho ótimo.

wuhkuh

Ficou ótimo pra uma primeira vez, o tradutor universal de Star Trek é real!

Krosna Terrestre

Bem que podia usar algo semelhante nas dublagens dos filmes, evitando que varios atores tenham a mesma voz.

Arnold

é muito legal isso, e mais o chrome pelo menos para pc, devia ter uma tradução de imagens também, assim como no celular onde vc aponta a câmera pra uma imagem e ela é traduzida, é claro que isso teria ser bem feito, mas sinto falta disso, eu consigo traduzir os texto mas as imagens não

Fabiano

E como ninguém usa Firefox mesmo, né....

kkkk brincadeira a parte, seria legal colocar um aviso sobre isso

Cassio

Bingo. Via Google Chrome, deu certo :)

Felipe Ventura

Eu testei esta página em diversos navegadores e só tive problema no Firefox. O Chrome, Edge antigo, Edge/Chromium, Opera e Vivaldi reproduzem os sons normalmente.

Infelizmente, o mesmo problema também ocorre no Firefox com a página do Google Research: https://google-research.git... Para ouvir os exemplos de áudio, você terá que usar outro navegador.

Ademir Filho

mesmo no site fonte não carrega.

Ademir Filho

mesma coisa aqui. :-(

Cassio

Aqui apenas os áudios originais em espanhol tocaram, os que foram traduzidos não tocam, segue print.

https://uploads.disquscdn.c...