Meta cria IA capaz de traduzir e transcrever quase 100 idiomas

Novo modelo se chama Seamless M4T e passou por treinamento com dezenas de bilhões de frases e 4 milhões de horas de fala

Por Giovanni Santa Rosa

há 11 meses

Meta (Imagem: Vitor Pádua/Tecnoblog)

A inteligência artificial funciona especialmente bem em tarefas relacionadas a idiomas. A Meta — dona de Facebook, Instagram e WhatsApp — sabe bem disso: a empresa liberou nesta terça-feira (22) um modelo chamado Seamless M4T, que é capaz de traduzir e transcrever quase 100 línguas.

O Seamless M4T trabalha com texto e linguagem, com possibilidades diversas:

reconhecimento de fala para quase 100 idiomas;
tradução de fala para texto para quase 100 idiomas de entrada e saída;
tradução de fala para fala para quase 100 idiomas de entrada e 36 de saída;
tradução de texto para texto para quase 100 idiomas;
tradução de texto para fala para quase 100 idiomas de entrada e 35 de saída.

Para criar o modelo, a Meta diz ter coletado dezenas de bilhões de frases escritas e 4 milhões de horas de fala disponíveis publicamente na web.

Ao site Axios, Paco Guzmán, pesquisador da Meta, diz que o Seamless M4T não usa modelos intermediários e aceita até mesmo mudanças de idioma no meio da frase.

“Isso permite que ele funcione melhor com populações que naturalmente misturam línguas no dia a dia”, comenta Guzmán.

O novo modelo da Meta não está disponível para qualquer pessoa usar. Ele foi liberado sob licença Creative Commons, para uso não-comercial. Pesquisadores e desenvolvedores poderão usar a tecnologia em seus trabalhos.

Meta e concorrentes investem em IA para tradução

Esta não é a primeira vez que a Meta desenvolve modelos de inteligência artificial para trabalhar com tradução.

Em 2022, a empresa lançou o No Language Left Behind, para traduções de texto para texto. Ele chegou a ser capaz de traduzir 200 idiomas.

Em seguida, veio o Universal Speech Translator, que funcionava com fala na entrada e na saída.

O Seamless M4T usa como base o Massively Multilingual Speech, framework da Meta para reconhecimento de fala, identificação de idioma e síntese de voz para mais de 1.100 línguas.

Entre as concorrentes, o Google trabalha no Universal Speech Model, uma iniciativa para compreender as 1.000 línguas mais faladas do mundo.

Já a Mozilla lidera o projeto Common Voice, uma coleção de vozes de diversos idiomas, para treinar algoritmos de reconhecimento de fala.

Com informações: Meta, Axios, TechCrunch, Reuters

Comentários da Comunidade

5 comentários

Participe da discussão

Os mais notáveis

Comentários com a maior pontuação

Rapha

Rapha 11 meses atrás

Curso de idiomas irá virar o novo curso de informática, daqui uns 10-15 anos. A tradução será tão perfeita que ninguém mais vai se dedicar a aprender um idioma novo, a procura será baixíssima e as poucas que sobreviverem provavelmente focarão apenas no mercado corporativo.

Acredito também em fone de ouvido com tradução simultânea, igual acontece nos filmes hj em dia.

1

Victor

Victor 11 meses atrás

uau que bacana cries in tradutor freelancer

1

Mister Quinzel

Mister Quinzel 11 meses atrás

Quando essa IA conseguir traduzir mandarim, japonês e coreano com gírias e nuances, aí sim os tradutores humanos estarão sob ameça?

Tiago

Tiago 11 meses atrás

Pixel Buds A

1

Luciano Couto

Luciano Couto 11 meses atrás

Esperando a IA traduzir textos antigos ainda não decifrados.

Relacionados

Autor(a)

Giovanni Santa Rosa

Repórter

Giovanni Santa Rosa é formado em jornalismo pela ECA-USP e cobre ciência e tecnologia desde 2012. Foi editor-assistente do Gizmodo Brasil e escreveu para o UOL Tilt e para o Jornal da USP. Cobriu o Snapdragon Tech Summit, em Maui (EUA), o Fórum Internacional de Software Livre, em Porto Alegre (RS), e a Campus Party, em São Paulo (SP). Atualmente, é autor no Tecnoblog.

Google vai resumir textos e reportagens usando inteligência artificial Bing Chat é liberado para todos os usuários do Chrome