Meio Bit » Arquivo » Internet » Eis como o Dropbox bloqueia compartilhamento de material com copyright sem olhar os arquivos

Eis como o Dropbox bloqueia compartilhamento de material com copyright sem olhar os arquivos

Uma explicação de como o Dropbox utiliza o hash de arquivos e uma lista negra da DMCA para identificar arquivos com copyright sem visualizar seu

10 anos atrás

dropbox

O Dropbox há algum tempo se envolveu numa baita polêmica quando um doutorando apresentou uma reclamação formal à FTC dizendo que ela mentiu sobre a total criptografia dos arquivos, que eles estavam 100% seguros e não poderiam ser identificados por ninguém. De acordo com a acusação, de posse de uma lista com arquivos declarados ilegais ela poderia identificar automaticamente e impedir seu compartilhamento, permitindo apenas o armazenamento na conta do usuário. Mas como ela faria isso?

A verdade é que o Dropbox ~em tese~ não lê nenhum arquivo disponibilizado, mas teria como identificar material com copyright através do hash. Uma função hash é um algoritmo que serve como um identificador com funções diversas: desde identificar sua senha sem ter que armazená-la de fato - ouviu Starbucks? - ou identificar um arquivo armazenado sem confundí-lo com outro.

hash-function

Um hash é uma cadeia hexadecimal, uma impressão digital que em teoria deve ser única (embora já houveram casos em que hackers conseguiram criar arquivos distintos com hashs iguais) e espera-se que as utilizadas pelo Dropbox sejam bem longas até para conseguir administrar a grande quantidade de dados que armazena de seus usuários. Ele possui funções práticas, no caso um usuário pode subir um arquivo grande "em segundos", quando na verdade o Dropbox identificou o hash e disponibilizou o arquivo armazenado anteriormente em sua conta. Isso evita que o mesmo arquivo seja armazenado mais de uma vez em seu servidores.

Pois bem: como o Dropbox possui a chave da criptografia empregada nos arquivos ele poderia olhar o conteúdo dos mesmos se for requisitado, e a DMCA é de fato parceira do serviço. Entretanto ela alega que o processo de remoção e identificação de links de arquivos com copyright é diferente: quando uma solicitação é feita o Dropbox remove o link e o hash do arquivo vai para uma lista negra impedindo seu compartilhamento, mas ele é mantido armazenado normalmente (note que segundo o Dropbox ele não verificou o conteúdo do arquivo, apenas desabilitou o compartilhamento). Quando alguém sobe um novo arquivo e clica em compartilhar, o Dropbox compara o hash com a lista e bloqueia o share caso encontre a chave. Por isso seria possível subir uma versão modificada do mesmo arquivo com um hash diferente que o Dropbox não o detectaria, entretanto isso dependeria de quebrar a criptografia do serviço de armazenamento, o que pode implicar em problemas bem maiores.

Com isso o Dropbox em tese não verifica seus arquivos, mas possui uma lista de documentos que não podem ser compartilhados e somente aí ele compara as hashs, ainda sem ver o conteúdo. Ainda assim não seria difícil para ela identificar conteúdo dos arquivos e identificar usuários caso a DMCA ou qualquer outra empresa de copyright exigisse via ordem judicial, mas ao menos não é como se robozinhos estivessem lendo todos os documentos armazenados no serviço.

Fonte: TC.

relacionados


Comentários