Dropbox escaneia imagens e PDFs para busca por texto

Recurso será exclusivo para contas pagas do serviço

André Fogaça
Por
• Atualizado há 2 anos e 4 meses

O Dropbox está criando uma forma de digitalizar arquivos como JPEG e PNG, para ajudar na busca por textos que podem estar inseridos dentro das imagens, indo até fotos que estão dentro das páginas de PDFs. A única ressalva é que este recurso não estará disponível para todos, indo apenas para quem assina alguma versão paga do serviço de armazenamento em nuvem.

A ferramenta, chamada de OCR (reconhecimento ótico de caracteres), é semelhante ao que outras empresas já fazem, como é o caso do Evernote. Ela vasculha os arquivos e utiliza uma tecnologia de reconhecimento de escrita para indexar na busca rápida de toda a plataforma de backup. Com isso, o Dropbox permite que você busque o conteúdo que está no visual do arquivo e ele apareça no resultado de forma instantânea.

Os arquivos PDF são os maiores problemas para esta engine, já que eles podem contar centenas de páginas com fotos e tirar uma por uma, para montar o índice da busca, é trabalhoso.

Não é para todos

Justamente por isso que a novidade é exclusiva para quem assina o Dropbox em algum plano pago, que vai de US$ 8,25 (aproximadamente R$ 31) por mês para 1 TB de espaço extra, indo até US$ 20 (mais ou menos R$ 75) por mês e por usuário, para empresas que quiserem espaço ilimitado.

Para diminuir o trabalho computacional necessário para extrair cada imagem de cada página de um PDF, o sistema tem um limite de 10 páginas por arquivo que será escaneado. Por enquanto o único idioma suportado pelo reconhecimento de texto é o inglês e os formatos de imagem que podem ser catalogados são JPEG, GIF (sem animação), PNG e TIFF.

Os primeiros usuários que notarão a possibilidade de buscar texto dentro de fotos são os dos planos corporativos, com as pessoas físicas nos próximos meses.

Com informações: Dropbox.

Receba mais notícias do Tecnoblog na sua caixa de entrada

* ao se inscrever você aceita a nossa política de privacidade
Newsletter
André Fogaça

André Fogaça

Ex-autor

André Fogaça é jornalista e escreve sobre tecnologia há mais de uma década. Cobriu grandes eventos nacionais e internacionais neste período, como CES, Computex, MWC e WWDC. Foi autor no Tecnoblog entre 2018 e 2021, e editor do Meio Bit, além de colecionar passagens por outros veículos especializados.

Relacionados