Escritores processam empresa do ChatGPT por infringir direitos autorais

Autores alegam que inteligência artificial consegue resumir livros com ótima precisão porque foi treinada com cópias obtidas ilegalmente

Por Giovanni Santa Rosa

há 1 ano

Os escritores Sarah Silverman, Christopher Golden e Richard Kadrey abriram processos contra a OpenAI, empresa por trás do ChatGPT, e contra a Meta. Eles acusam as empresas de desrespeitar direitos autorais ao treinar suas inteligências artificiais de geração de texto.

A ação foi movida na Corte Distrital do Norte da Califórnia. Ela alega que o ChatGPT, da OpenAI, e o LLaMA, da Meta, foram treinados com conjuntos de dados adquiridos ilegalmente, que continham as obras dos autores.

Os livros estariam em sites como o Z-Library (que foi derrubado em novembro de 2022), o Library Genesis e o Bibliotik, além de serem compartilhados por torrent.

Como evidência do uso ilegal, os escritores apontam que o ChatGPT é capaz de resumir seus livros com ótima precisão, apesar de errarem alguns detalhes, o que indicaria que eles tiveram acesso às obras completas.

Já em relação ao LLaMA, da Meta, os autores dizem ter encontrado as obras no conjunto de dados que a empresa usou para treinar seus modelos de IA.

A Meta tem uma abordagem mais aberta sobre o assunto que a OpenAI: em um artigo, ela detalha as fontes usadas para desenvolver seu gerador de texto.

O conjunto de dados se chama ThePile (”a pilha”, em tradução livre) e foi criado por uma empresa EleutherAI. Em um artigo, ela afirma que ele usa uma cópia dos conteúdos da Bibliotik.

Escritório de advocacia já move outras ações contra ChatGPT

Os três autores são representados no processo pelos advogados Joseph Saveri e Matthew Butterick. A dupla também entrou com outra ação contra a OpenAI, em nome dos escritores Mona Awad e Paul Tremblay, na mesma corte dos EUA.

Saveri e Butterick criaram até um site chamado LLM Litigation (“litígio contra grandes modelos de linguagem”, em tradução livre) para divulgar as ações.

Além dos autores, o escritório de Saveri representa artistas que entraram com uma ação coletiva contra o Stable Diffusion. O algoritmo supostamente toma ilustrações, desenhos e outras obras como base para gerar imagens.

Outro processo é contra o GitHub Copilot, que usa IA para sugerir trechos de código. Todas essas práticas podem caracterizar violação de direitos autorais.

Com informações: The Verge

Escrito por

Giovanni Santa Rosa

Repórter

Giovanni Santa Rosa é formado em jornalismo pela ECA-USP e cobre ciência e tecnologia desde 2012. Foi editor-assistente do Gizmodo Brasil e escreveu para o UOL Tilt e para o Jornal da USP. Cobriu o Snapdragon Tech Summit, em Maui (EUA), o Fórum Internacional de Software Livre, em Porto Alegre (RS), e a Campus Party, em São Paulo (SP). Atualmente, é autor no Tecnoblog.

Comentários da Comunidade

$com 40% mais IA que a concorrência. ¯\_(ツ)_/¯$

8 comentários

Participe da discussão

Os mais notáveis

Comentários com a maior pontuação

Matheus Motta 1 ano atrás

Direitos autorais vão matar essa tecnologia

Daniel R. Pinheiro 1 ano atrás

Como que isso prova que as cópias foram obtidas ilegalmente?

Desenvolvimentista 1 ano atrás

Não no japão, que eles mudaram a lei pra dizer quer nada do que IA pegar tem direitos autorais!

Sérgio 1 ano atrás

Se você precisa pagar pra ter acesso à obra, seja física ou digital, certamente a obra está sob algum direito autoral. E até onde sei as empresas não programaram os seus algoritmos para burlar as proteções [das obras digitais]. Então certamente o acesso que se obteve às obras foi de lugares onde se publica conteúdo pirata.

Eu mesmo tenho cópias digitais devidamente pagas. Eu criar um resumo sobre elas não constitui violação de direitos autorais.

Ainda não vi nenhuma relação direta entre o ChatGPT conseguir resumir uma obra e isso provar da OpenAI tê-las obtido ilegalmente.

Se a OpenAI usou de cópias obtidas de forma legal para o banco de dados do ChatGPT, não a fim de comercialização, mas para fins de estudo, não vejo violação. Seria o mesmo que me cobrar porque divulgo em minhas redes os resumos de livros que eu li e os tenho armazenado.

Gustavo Guerra 1 ano atrás

Outra possibilidade é as IAs terem aprendido todos os detalhes das obras por meios públicos, como usuários comentando nas redes sociais ou resumos já feitos na internet. O que explica talvez elas não serem tão precisas, como aponta os próprios reclamantes.

Leis de direitos autorais são tão malucas, que não existe um consenso sobre resumos serem ou não roubo de propriedade intelectual:

com 40% mais IA que a concorrência. ¯\_(ツ)_/¯ 1 ano atrás

Até mesmo o porque ninguém faz resenha/resumo de livros na internet…

Escritório de advocacia já move outras ações contra ChatGPT

Relacionados

Escrito por