OpenAI lança a IA de vídeos Sora; saiba como funciona

Anunciada em fevereiro, Sora será liberada para assinantes do ChatGPT Plus e Pro. Ferramenta transforma texto em vídeo, mas ainda tem problemas.

Giovanni Santa Rosa

A OpenAI liberou a inteligência artificial Sora para usuários assinantes do ChatGPT Plus ou Pro. Ela é capaz de gerar vídeos a partir de pedidos, instruções e descrições em texto, como já acontece com modelos de imagens estáticas, como o Dall-E.

A Sora terá uma interface própria, independente de outros produtos da OpenAI. O início é com um pedido em texto, mas há opções para definir proporções da imagem, resolução, duração e variações geradas. Depois de selecionar uma das criações, é possível usar ferramentas para recortar, remixar ou até mesmo fazer alterações no prompt.

Neste primeiro momento, a Sora poderá criar vídeos de até 20 segundos em resolução 1080p. No entanto, haverá limitações, de acordo com o plano do usuário, por meio de um sistema de créditos.

Assinantes do ChatGPT Plus poderão gerar até 50 vídeos por mês na resolução 480p. Para criar peças em 720p, a duração e a quantidade de vídeos será reduzida. Já o plano Pro dará acesso a um uso dez vezes maior, com vídeos mais longos e resoluções maiores.

Segundo a OpenAI, a Sora estará disponível nos Estados Unidos e na maioria dos países em que o ChatGPT está disponível. Usuários europeus, porém, terão que esperar um pouco mais. Além de liberar o modelo, a OpenAI publicou um site dedicado à ferramenta. Por lá, os usuários poderão mostrar o que criaram e qual foi o prompt usado.

Sora ainda não está pronta e terá restrições

A Sora foi anunciada em fevereiro de 2024, mas só agora o público geral terá acesso ao modelo. Até então, apenas artistas convidados e equipes de testes de segurança puderam usar a ferramenta. Em novembro, alguns destes artistas vazaram um acesso ao gerador, como forma de protesto contra o tratamento recebido da OpenAI.

A companhia impôs algumas limitações para impedir usos nocivos da Sora, como bloqueios a conteúdos envolvendo abuso infantil e deepfakes sexuais. Além disso, os vídeos gerados contarão com uma marca d’água visível e metadados para identificação.

A empresa reconhece que a IA ainda tem limitações. Segundo o texto de lançamento, o modelo “frequentemente gera [situações com] física irrealista e tem dificuldade com ações complexas em longas durações”.

O youtuber Marques Brownlee, por exemplo, testou a Sora e considera que ela é excelente para criar paisagens e conteúdo estilizado, mas falha em pontos básicos de física, como permanência do objeto.

Com informações: OpenAI, Ars Technica, Engadget, Axios

Relacionados

Escrito por

Giovanni Santa Rosa

Giovanni Santa Rosa

Repórter

Giovanni Santa Rosa é formado em jornalismo pela ECA-USP e cobre ciência e tecnologia desde 2012. Foi editor-assistente do Gizmodo Brasil e escreveu para o UOL Tilt e para o Jornal da USP. Cobriu o Snapdragon Tech Summit, em Maui (EUA), o Fórum Internacional de Software Livre, em Porto Alegre (RS), e a Campus Party, em São Paulo (SP). Atualmente, é autor no Tecnoblog.