Meta cria IA capaz de traduzir e transcrever quase 100 idiomas

Novo modelo se chama Seamless M4T e passou por treinamento com dezenas de bilhões de frases e 4 milhões de horas de fala

Giovanni Santa Rosa

A inteligência artificial funciona especialmente bem em tarefas relacionadas a idiomas. A Meta — dona de Facebook, Instagram e WhatsApp — sabe bem disso: a empresa liberou nesta terça-feira (22) um modelo chamado Seamless M4T, que é capaz de traduzir e transcrever quase 100 línguas.

O Seamless M4T trabalha com texto e linguagem, com possibilidades diversas:

  • reconhecimento de fala para quase 100 idiomas;
  • tradução de fala para texto para quase 100 idiomas de entrada e saída;
  • tradução de fala para fala para quase 100 idiomas de entrada e 36 de saída;
  • tradução de texto para texto para quase 100 idiomas;
  • tradução de texto para fala para quase 100 idiomas de entrada e 35 de saída.

Para criar o modelo, a Meta diz ter coletado dezenas de bilhões de frases escritas e 4 milhões de horas de fala disponíveis publicamente na web.

Ao site Axios, Paco Guzmán, pesquisador da Meta, diz que o Seamless M4T não usa modelos intermediários e aceita até mesmo mudanças de idioma no meio da frase.

“Isso permite que ele funcione melhor com populações que naturalmente misturam línguas no dia a dia”, comenta Guzmán.

O novo modelo da Meta não está disponível para qualquer pessoa usar. Ele foi liberado sob licença Creative Commons, para uso não-comercial. Pesquisadores e desenvolvedores poderão usar a tecnologia em seus trabalhos.

Meta e concorrentes investem em IA para tradução

Esta não é a primeira vez que a Meta desenvolve modelos de inteligência artificial para trabalhar com tradução.

Em 2022, a empresa lançou o No Language Left Behind, para traduções de texto para texto. Ele chegou a ser capaz de traduzir 200 idiomas.

Em seguida, veio o Universal Speech Translator, que funcionava com fala na entrada e na saída.

O Seamless M4T usa como base o Massively Multilingual Speech, framework da Meta para reconhecimento de fala, identificação de idioma e síntese de voz para mais de 1.100 línguas.

Entre as concorrentes, o Google trabalha no Universal Speech Model, uma iniciativa para compreender as 1.000 línguas mais faladas do mundo.

Já a Mozilla lidera o projeto Common Voice, uma coleção de vozes de diversos idiomas, para treinar algoritmos de reconhecimento de fala.

Com informações: Meta, Axios, TechCrunch, Reuters

Leia | Como traduzir palavras para vários idiomas no Google Planilhas

Relacionados

Escrito por

Giovanni Santa Rosa

Giovanni Santa Rosa

Repórter

Giovanni Santa Rosa é formado em jornalismo pela ECA-USP e cobre ciência e tecnologia desde 2012. Foi editor-assistente do Gizmodo Brasil e escreveu para o UOL Tilt e para o Jornal da USP. Cobriu o Snapdragon Tech Summit, em Maui (EUA), o Fórum Internacional de Software Livre, em Porto Alegre (RS), e a Campus Party, em São Paulo (SP). Atualmente, é autor no Tecnoblog.