Meta cria IA capaz de traduzir e transcrever quase 100 idiomas
Novo modelo se chama Seamless M4T e passou por treinamento com dezenas de bilhões de frases e 4 milhões de horas de fala
Novo modelo se chama Seamless M4T e passou por treinamento com dezenas de bilhões de frases e 4 milhões de horas de fala
A inteligência artificial funciona especialmente bem em tarefas relacionadas a idiomas. A Meta — dona de Facebook, Instagram e WhatsApp — sabe bem disso: a empresa liberou nesta terça-feira (22) um modelo chamado Seamless M4T, que é capaz de traduzir e transcrever quase 100 línguas.
O Seamless M4T trabalha com texto e linguagem, com possibilidades diversas:
Para criar o modelo, a Meta diz ter coletado dezenas de bilhões de frases escritas e 4 milhões de horas de fala disponíveis publicamente na web.
Ao site Axios, Paco Guzmán, pesquisador da Meta, diz que o Seamless M4T não usa modelos intermediários e aceita até mesmo mudanças de idioma no meio da frase.
“Isso permite que ele funcione melhor com populações que naturalmente misturam línguas no dia a dia”, comenta Guzmán.
O novo modelo da Meta não está disponível para qualquer pessoa usar. Ele foi liberado sob licença Creative Commons, para uso não-comercial. Pesquisadores e desenvolvedores poderão usar a tecnologia em seus trabalhos.
Esta não é a primeira vez que a Meta desenvolve modelos de inteligência artificial para trabalhar com tradução.
Em 2022, a empresa lançou o No Language Left Behind, para traduções de texto para texto. Ele chegou a ser capaz de traduzir 200 idiomas.
Em seguida, veio o Universal Speech Translator, que funcionava com fala na entrada e na saída.
O Seamless M4T usa como base o Massively Multilingual Speech, framework da Meta para reconhecimento de fala, identificação de idioma e síntese de voz para mais de 1.100 línguas.
Entre as concorrentes, o Google trabalha no Universal Speech Model, uma iniciativa para compreender as 1.000 línguas mais faladas do mundo.
Já a Mozilla lidera o projeto Common Voice, uma coleção de vozes de diversos idiomas, para treinar algoritmos de reconhecimento de fala.
Com informações: Meta, Axios, TechCrunch, Reuters
Leia | Como traduzir palavras para vários idiomas no Google Planilhas