57% do conteúdo na web foi criado por robôs, mostra estudo

Pesquisa realizada pela AWS aponta que maior parte dos textos na internet são gerados por robôs e IAs. Ironicamente, isso é prejudicial para IAs generativas

Por Felipe Freitas

há 4 meses

Um estudo divulgado pela AWS nesta semana indica que 57% do conteúdo textual da internet já é gerado por IAs. A pesquisa mostra que a maioria do que é publicado na rede é tradução criada com Machine Translation, inteligências artificiais focadas em traduzir textos. Contudo, isso não é só ruim para os usuários e criadores, mas também prejudica o treinamento de IAs generativas.

Como os LLMs dependem de conteúdo humano e especializado para entregar uma informação mais precisa, a replicação de textos utilizando IAs e apenas com traduções impacta no desempenho das IAs generativas.

O estudo da AWS destaca que as traduções são falhas porque vêm de textos mal escritos. Consequentemente, esse material traduzido entregará informações erradas ou de má-qualidade para os usuários. Além disso, ainda há a questão de que o LLM “reciclará” conteúdos para o seu treinamento — é IA treinando IA, quase um esquema de pirâmide.

Inteligência artificial é usada para criar textos, que depois são usados para treinar as IAs, que aí são usadas para gerar mais textos e o ciclo não para (Imagem: Vitor Pádua / Tecnoblog)

Qualidade das respostas cai a cada prompt

A pesquisa mostra que a qualidade e precisão das respostas geradas pelo LLMs cai com o tempo. Se você acha que a IA do Google sugerir passar cola na pizza é ruim, espere mais alguns anos.

Para quem usa o ChatGPT, Gemini, Copilot ou outra IA para tarefas mais simples, essa queda de qualidade pode passar despercebida. Apesar disso, no fim de 2023 e início de 2024 tivemos o caso da “preguiça” do ChatGPT. Na Comunidade do Tecnoblog, alguns leitores já reclamaram de uma certa queda de qualidade das IAs generativas.

O estudo da AWS aponta uma solução para isso: o uso de tecnologias de detecção de material gerado por Machine Translation (MT). Ao contrário dos tradutores básicos, que praticamente traduzem palavra por palavra, as MTs usam IAs para avaliar o contexto do texto.

Com informações: Windows Central

Leia | O que são redes neurais artificiais? Entenda mais sobre a técnica inspirada no cérebro humano

Escrito por

Felipe Freitas

Repórter

Felipe Freitas é jornalista graduado pela UFSC, interessado em tecnologia e suas aplicações para um mundo melhor. Na cobertura tech desde 2021 e micreiro desde 1998, quando seu pai trouxe um PC para casa pela primeira vez. Passou pelo Adrenaline/Mundo Conectado. Participou da confecção de reviews de smartphones e outros aparelhos.

Comentários da Comunidade

21 comentários

Participe da discussão

Tori Niwikari 4 meses atrás

Isso reforça ainda mais a teoria da internet morta.
A internet já não é a mesma a anos, passou de um lugar interessante para um lugar corporativo e morto, cheio de polarização.

Matt Gelinski 4 meses atrás

Esse lance da polarização é a própria população se destruindo. Isso aí é internet morta há um bom tempo. E vai piorar ainda mais agora…

Corvo 4 meses atrás

A impressão que tenho é que a internet como conhecemos está prestes a entrar em colapso por excesso de informações lixo.

Até o início do século onde tinha sei la, 30% do que tem hoje de pessoas com acesso a internet e gerando conteúdo, era muito mais fácil obter diversas informações do que é hoje.

Vai procurar um arquivo de Bios ou Firmware por exemplo hoje é praticamente impossível achar sem ter que pagar, troca de informações como faziamos em foruns praticamente acabou, parece que hoje todo mundo tem uma segunda intenção ($$$) por trás, é só video de informação rasa (e muitas vezes incorreta) pra no fim tentar te vender o curso pra ter acesso a um conteúdo provavelmente com informações duvidosas pois qualquer zé mané que nem mal sabe conjugar verbo se acha o Professor porque tem milhares de Seguidores…

Parece que ninguem mais faz nada por prazer como antigamente trocavamos muitas informações em fóruns, já cansei de desenvolver ferramentas em comunidades Open Source sem ganhar um centavo pelo simples prazer de Fazer, de aprender mais e me desenvolver ajudando e trocando informações/conhecimento.

Só quem é dessa época vai me entender, essa internet ultra rápida e com informações instantâneas e todas as facilidades que temos hoje, mas nunca será nem perto do que era a velha web dos anos 90 e início dos 2k.
#R.I.P.

Felipe Silva 4 meses atrás

Esse numero faz sentido pra mim, tenho lido muitos textos rasos e sem conclusão ultimamente, já vinha suspeitando que eram tudo gerado por robôs.

Maycon Cruz 4 meses atrás

Ao meu ver, nem é porque as pessoas não fazem mais por prazer ou algo do tipo, vide que fóruns de mais diversos assuntos ainda existem se você procurar. Ênfase no “procurar”: com a internet sendo ditada por motores de busca e redes sociais com fins puramente corporativos, os algoritmos vão fazer de tudo para empurrar conteúdo de gente que abre a carteira e injeta doses cavalares de grana.

Em um ambiente destes, qualquer conteúdo feito por gosto pessoal e hobby vai ser soterrado pelas pilhas e mais pilhas de informações de qualidade porca e mequetrefe. Ao meu ver, o trabalho que estou tendo para procurar informações relevantes continua mais ou menos o mesmo que eu tinha a décadas atrás, só que agora, tenho que lidar com um monte de “normies” que antes sequer tocavam num computador e agora compartilham o tráfego comigo e causando ruído.

Exibir mais comentários

57% do conteúdo na web foi criado por robôs, mostra estudo

Qualidade das respostas cai a cada prompt

Responde

Relacionados

Escrito por