Meio Bit » Internet » Google vai classificar todo conteúdo gerado por IAs como spam

Google vai classificar todo conteúdo gerado por IAs como spam

Especialista em SEO diz que quaisquer conteúdos gerados por IAs, mesmo as avançadas como o GPT-3, violam regras de monetização do Google

2 anos atrás

O Google desferiu uma voadora com os dois pés no peito de agências de notícias e publicidade, que andavam empolgadas com a evolução de ferramentas como o GPT-3, da OpenAi, capazes de escrever textos coerentes com um mínimo de entradas de dados. Alguns acreditavam que ferramentas de inteligência artificial do tipo seriam "o futuro do jornalismo", em que mesmo as postagens mais complexas seriam autotomizadas.

O Google, porém, entende que qualquer postagem, publicação ou notícia em sites, blogs, etc. identificadas como escritas por uma IA, mesmo as inteligentes e avançadas, ferem suas regras, logo, serão todas tratadas como spam. Claro, há alguns caveats a considerar.

O tal "futuro do jornalismo digital" levou uma rasteira do Google (Crédito: European Federation of Journalists)

O tal "futuro do jornalismo digital" levou uma rasteira do Google (Crédito: European Federation of Journalists)

Os memes e piadas a respeito dos robôs substituindo os humanos em todas as categorias de trabalho, mesmo os mais especializados, circulam há anos, embora seja preciso reconhecer que em alguns setores, a mecanização é uma realidade há muito tempo, que afeta principalmente os menos qualificados, vulgo o peão de chão de fábrica.

Hoje, existem sistemas de cirurgia remota, como o Da Vinci, presente inclusive no Brasil, mas que dependem do operador (em ambos sentidos); no entanto, há esforços que buscam dispensar o fator humano; outros sistemas, como o Watson, conseguem prover diagnósticos precisos apenas mastigando dados, ainda que apresentem alguns problemas.

Temos desde sistemas autômatos que identificam pacotes e calculam pagamentos a seguradoras, restaurantes com garçons-robô, terminais de contêineres automatizados, e supermercados quase sem funcionários, mas os robôs usados aqui executam tarefas triviais, quase mecânicas.

As coisas começaram a mudar quando IAs menos triviais começaram a apresentar resultados menos "mecânicos", como a AlphaZero do DeepMind, que aprendeu sozinha a jogar Go e outros jogos de tabuleiro, ficando bem à frente de suas antecessoras, ao aprimorar seus algoritmos de pensamento heurístico, um processo que até anos atrás, acreditava-se ser exclusividade humana.

A criação de textos coerentes por sistemas especialistas também vem avançando. Em 2015, a AP apresentou uma ferramenta capaz de publicar informes econômicos, o setor mais engessado do jornalismo, de forma autônoma e sem interferência humana; em 2017, a Associação de Imprensa do Reino Unido anunciou a criação de um site totalmente gerido por IAs, que ficariam a cargo das notícias mais simples e invariáveis, basicamente informes do tempo, saúde, horóscopo, segurança, etc. Ironicamente, a iniciativa foi financiada pelo Google.

Porém, foi com o surgimento de ferramentas como o GPT-3 (Generative Pre-trained Transformer-3), uma ferramenta criada pela OpenAi, um grupo voltado ao desenvolvimento de IAs amigáveis, que mostrou o potencial de um sistema voltado para a composição de textos longos, coesos e com contexto, que podem se passar por redações escritas por humanos.

A geração anterior, o GPT-2, havia aprendido a escrever tão bem, que a empresa não apresentou o trabalho completo para revisão, com medo que o algoritmo fosse usado para compor Fake News, o que se provou possível, mesmo quando direcionado a um público específico. O GPT-3, por sua vez, foi empregado em um adventure de texto online chamado AI Dungeon, que cria histórias com base em dados fornecidos pelos usuários, e bem... humanos são humanos.

Isso posto, há uma preocupação legítima quanto ao uso de IAs em redações para a composição de notícias, não necessariamente falsas, mas para reduzir custos com jornalistas, no que um software poderia ser encarregado de escrever mesmo artigos complexos; o jornal The Guardian, por exemplo, "demonstrou" que isso seria possível, em uma postagem inteiramente escrita pelo GPT-3 (mais sobre este caso a seguir).

Foi então que o Google apresentou sua opinião sobre o assunto, que desagradou alguns e levantou algumas questões.

;

Em um hangout realizado pelo Google no dia 1º de abril de 2022, o advogado John Mueller, considerado a autoridade máxima da companhia em SEO, o conjunto de estratégias para otimização dos resultados de busca, o qual todo site, blog e veículo de mídia deve observar se quiser fazer uma graninha com o AdSense, foi categórico ao explicar como Mountain View vê a geração de textos e postagens por IAs avançadas, como o GPT-3, algo que a empresa já havia se expressado como sendo contra:

"Para nós (o Google), publicações geradas por IAs ainda se enquadram na categoria de conteúdos gerados automaticamente, que é algo que nós delineamos em nossas Diretrizes para Webmasters, praticamente desde o início (da companhia).

As pessoas vêm criando esse tipo de conteúdo de várias formas diferentes, e para nós, se você está usando ferramentas de aprendizado de máquina para gerar seu conteúdo, para nós, é a mesma coisa que reunir palavras aleatoriamente, buscando sinônimos, ou usando os truques de tradução que as pessoas estão acostumadas a usar.

É possível que a qualidade desses conteúdos sejam um pouco melhores do que os gerados por ferramentas mais antigas, mas para nós, ainda é conteúdo gerado automaticamente, ou seja, continua sendo contra as regras de nossas Diretrizes para Webmasters. Dessa forma, nós consideraremos como spam."

De uma maneira resumida, Mueller disse que não importa o intuito que o site, blog ou veículo tenha para empregar uma ferramenta especializada, como o GPT-3 ou o Transformer, para a composição de textos, mesmo que eles sejam coerentes e providos de sentido e contexto. Para o Google, eles serão tratados como artigos compostos por ferramentas já manjadas, como tradutores automáticos ou pescadores de publicações alheias, e todos serão tratados como spam.

Vale dizer que quando um site é identificado como propagador de spam, não só a monetização do AdSense é sumariamente cortada, como o ranking de SEO despenca vertiginosamente nos resultados de busca do Google, fazendo com que a visitação caia. De fato, ninguém na internet deseja que o Google classifique seu site como propagador de conteúdo de baixa qualidade, como serão tratados os textos gerados por IA.

Agora, os caveats. Primeiro, a logística de implementar um "jornalista-robô" em uma redação, ao menos no momento, implica em deixá-lo sob cuidados de um, ou mais, redatores humanos, visto que mesmo os algoritmos mais avançados ainda dão vários tropeços. Voltando ao caso do texto do The Guardian escrito pelo GPT-3, o veículo admitiu que submeteu o software à composição de um texto de 6 mil palavras, e "selecionou as sentenças" melhor compostas, ou seja, o artigo passou por uma revisão pesada. Por humanos.

Em um cenário normal, um jornalista não recebe a tarefa de redigir 5.000 palavras para que o revisor selecione apenas 3.000, o editor corte mais 500 e publique. Ou ele é aprovado na íntegra, ou é rejeitado e o autor que o reescreva.

Não importa a qualidade de um texto gerado pelo GPT-3; para o Google, é spam do mesmo jeito (Crédito: traveler1116/Getty Images)

Não importa a qualidade de um texto gerado pelo GPT-3; para o Google, é spam do mesmo jeito (Crédito: traveler1116/Getty Images)

Isso posto, o Google não deveria agir outra vez como o órgão censor soft da internet (nota: ele faz isso o tempo todo), ameaçando de desmonetização e queda nos rankings os sites, blogs e veículos que ousarem publicar um texto gerado pelo GPT-3 e similares.

Em um cenário ideal, o público deveria ser livre para escolher como consumir conteúdo, mas a verdade é que em tempos de Fake News e guerra de narrativas, intensificadas ainda mais pelo conflito entre a Rússia e Ucrânia, a gigante das buscas não quer arriscar.

Nesse sentido, o Google está fechando brechas que permitiriam a veículos mal-intencionados a fazerem dinheiro com o AdSense, gerando artigos automáticos que seriam difíceis de serem identificados como escritos por IAs, principalmente se lembrarmos que mentir em texto é mais eficiente do que criar um deepfake.

Estes, assim como os veículos que sonhavam em economizar uma grana colocando IAs no lugar de jornalistas, terão que rever seus planos, se quiserem continuar jogando pelas regras do Google, o patrão da internet, e receber seus centavos do AdSense.

Fonte: Search Engine Journal

Leia mais sobre: , , , .

relacionados


Comentários