Amazon promete investigar se Perplexity AI está burlando bloqueio de sites

Acusada de plágio por Wired e Forbes, Perplexity AI estaria coletando conteúdo sem autorização, com robô hospedado em servidor da AWS

Giovanni Santa Rosa
Por
Inteligência artificial
Chatbot da Perplexity estaria lendo matérias mesmo sem autorização das editoras (Imagem: Vitor Pádua / Tecnoblog)

A Amazon iniciou uma investigação para saber se a Perplexity AI está usando seus servidores para coletar conteúdo da web sem autorização. Há algumas semanas, Wired e Forbes acusaram a empresa de inteligência artificial de violar direitos autorais e plagiar matérias.

Segundo a Wired, um programa hospedado em um servidor da Amazon Web Services ignorou as instruções do Robots Exclusion Protocol e acessou textos publicados pela editora Condé Nast, da qual faz parte. A reportagem ainda afirma que The Guardian, Forbes e The New York Times detectaram atividades parecidas.

O Robots Exclusion Protocol é um padrão que contém uma série de instruções para permitir ou proibir o acesso automatizado às páginas. Elas devem ser armazenadas em um arquivo robots.txt no domínio do site. A própria Perplexity AI traz, em sua documentação, instruções de como usar este protocolo para rejeitar o robô da startup.

Apesar de usado desde os anos 1990 e respeitado por grandes empresas, o protocolo não bloqueia os robôs, apenas acrescenta uma sinalização para que eles leiam ou ignorem o conteúdo. Mesmo assim, a Amazon declarou à Wired que usuários de seus servidores são obrigados a seguir o que manda o arquivo robots.txt — a regra faz parte dos termos de serviço da empresa.

Fachada de prédio da Amazon Web Services
Atividade foi detectada em robô armazenado na Amazon Web Services (Imagem: Tony Webster / Flickr)

Sara Platnick, porta-voz da Perplexity, disse à Wired que a startup já respondeu às questões da AWS e negou que os robôs estejam desrespeitando os protocolos. Mesmo assim, ela afirma que, se o usuário especificar um endereço da web ao chatbot, o robô não levará em conta as instruções do arquivo robots.txt.

Aravind Srinivas, CEO da Perplexity, negou que a empresa ignore o protocolo de exclusão de robôs. O executivo alega que a empresa usa crawlers de terceiros além de seu próprio, e que o bot identificado pela Wired era um deles.

Perplexity AI vem sendo acusada de plágio

Nas últimas semanas, Wired e Forbes declararam que a Perplexity AI vem desrespeitando direitos autorais e deixando de dar créditos às publicações. Além do acesso indevido que a Wired identificou, a revista diz que o chatbot da startup praticamente copia suas reportagens e ainda gera resumos imprecisos do conteúdo.

A Forbes também trouxe reclamações similares. Uma matéria exclusiva foi praticamente replicada, com “frases estranhamente similares” e “trechos inteiramente roubados”, sem resumir o conteúdo. Para piorar, a Perplexity listou como fontes apenas sites que repercutiram a reportagem, sem colocar um link diretamente para a Forbes.

Com informações: Engadget, Wired

Relacionados