Dropbox escaneia imagens e PDFs para busca por texto
Recurso será exclusivo para contas pagas do serviço
Recurso será exclusivo para contas pagas do serviço
O Dropbox está criando uma forma de digitalizar arquivos como JPEG e PNG, para ajudar na busca por textos que podem estar inseridos dentro das imagens, indo até fotos que estão dentro das páginas de PDFs. A única ressalva é que este recurso não estará disponível para todos, indo apenas para quem assina alguma versão paga do serviço de armazenamento em nuvem.
A ferramenta, chamada de OCR (reconhecimento ótico de caracteres), é semelhante ao que outras empresas já fazem, como é o caso do Evernote. Ela vasculha os arquivos e utiliza uma tecnologia de reconhecimento de escrita para indexar na busca rápida de toda a plataforma de backup. Com isso, o Dropbox permite que você busque o conteúdo que está no visual do arquivo e ele apareça no resultado de forma instantânea.
Os arquivos PDF são os maiores problemas para esta engine, já que eles podem contar centenas de páginas com fotos e tirar uma por uma, para montar o índice da busca, é trabalhoso.
Justamente por isso que a novidade é exclusiva para quem assina o Dropbox em algum plano pago, que vai de US$ 8,25 (aproximadamente R$ 31) por mês para 1 TB de espaço extra, indo até US$ 20 (mais ou menos R$ 75) por mês e por usuário, para empresas que quiserem espaço ilimitado.
Para diminuir o trabalho computacional necessário para extrair cada imagem de cada página de um PDF, o sistema tem um limite de 10 páginas por arquivo que será escaneado. Por enquanto o único idioma suportado pelo reconhecimento de texto é o inglês e os formatos de imagem que podem ser catalogados são JPEG, GIF (sem animação), PNG e TIFF.
Os primeiros usuários que notarão a possibilidade de buscar texto dentro de fotos são os dos planos corporativos, com as pessoas físicas nos próximos meses.
Com informações: Dropbox.