57% do conteúdo na web foi criado por robôs, mostra estudo

Pesquisa realizada pela AWS aponta que maior parte dos textos na internet são gerados por robôs e IAs. Ironicamente, isso é prejudicial para IAs generativas

Felipe Freitas
Por
Inteligência artificial
Pesquisa mostra que material gerado por IA vem crescendo na internet (Imagem: Vitor Pádua / Tecnoblog)

Um estudo divulgado pela AWS nesta semana indica que 57% do conteúdo textual da internet já é gerado por IAs. A pesquisa mostra que a maioria do que é publicado na rede é tradução criada com Machine Translation, inteligências artificiais focadas em traduzir textos. Contudo, isso não é só ruim para os usuários e criadores, mas também prejudica o treinamento de IAs generativas.

Como os LLMs dependem de conteúdo humano e especializado para entregar uma informação mais precisa, a replicação de textos utilizando IAs e apenas com traduções impacta no desempenho das IAs generativas.

O estudo da AWS destaca que as traduções são falhas porque vêm de textos mal escritos. Consequentemente, esse material traduzido entregará informações erradas ou de má-qualidade para os usuários. Além disso, ainda há a questão de que o LLM “reciclará” conteúdos para o seu treinamento — é IA treinando IA, quase um esquema de pirâmide.

Inteligência artificial
Inteligência artificial é usada para criar textos, que depois são usados para treinar as IAs, que aí são usadas para gerar mais textos e o ciclo não para (Imagem: Vitor Pádua / Tecnoblog)

Qualidade das respostas cai a cada prompt

A pesquisa mostra que a qualidade e precisão das respostas geradas pelo LLMs cai com o tempo. Se você acha que a IA do Google sugerir passar cola na pizza é ruim, espere mais alguns anos.

Para quem usa o ChatGPT, Gemini, Copilot ou outra IA para tarefas mais simples, essa queda de qualidade pode passar despercebida. Apesar disso, no fim de 2023 e início de 2024 tivemos o caso da “preguiça” do ChatGPT. Na Comunidade do Tecnoblog, alguns leitores já reclamaram de uma certa queda de qualidade das IAs generativas.

O estudo da AWS aponta uma solução para isso: o uso de tecnologias de detecção de material gerado por Machine Translation (MT). Ao contrário dos tradutores básicos, que praticamente traduzem palavra por palavra, as MTs usam IAs para avaliar o contexto do texto.

Com informações: Windows Central

Relacionados

Escrito por

Felipe Freitas

Felipe Freitas

Repórter

Felipe Freitas é jornalista graduado pela UFSC, interessado em tecnologia e suas aplicações para um mundo melhor. Na cobertura tech desde 2021 e micreiro desde 1998, quando seu pai trouxe um PC para casa pela primeira vez. Passou pelo Adrenaline/Mundo Conectado. Participou da confecção de reviews de smartphones e outros aparelhos.

Temas populares