O que é OCR? [Optical Character Recognition]
Reconhecimento de texto em imagens; saiba o que é OCR, como a tecnologia funciona e onde é mais utilizada atualmente
Reconhecimento de texto em imagens; saiba o que é OCR, como a tecnologia funciona e onde é mais utilizada atualmente
O mais comum era tratar a imagem como um arquivo único, “chapado” e sem identificações adicionais. Veja abaixo, o que é OCR — Optical Character Recognition — e como essa tecnologia vem transformando a profundidade de utilização de imagens digitais. Os usos mais conhecidos estão nos editores de texto Microsoft Word e Google Docs.
Literalmente, OCR significa Optical Character Recognition — sigla em inglês para reconhecimento óptico de símbolos. É uma tecnologia amplamente difundida para reconhecer texto dentro de imagens, como fotos e documentos digitalizados.
A tecnologia OCR é usada para converter virtualmente qualquer tipo de imagem contendo texto escrito — digitado, manuscrito ou impresso — em versões de dados legíveis por máquina.
A tecnologia OCR tornou-se popular no início dos anos 1990, nas tentativas de digitalizar jornais históricos. Como evolução, a tecnologia passou por muitos aprimoramentos. Atualmente, oferece-se uma precisão de OCR quase perfeita. Métodos avançados como Zonal OCR são usados para automatizar fluxos de trabalho complexos baseados em documentos, reduzindo custos.
Uma aplicação comum da tecnologia OCR é a conversão automatizada de um PDF, TIFF ou JPG baseado em imagem para um arquivo de texto legível por máquina. Os arquivos digitais processados por OCR, como recibos, contratos, faturas, demonstrações financeiras etc. são facilmente:
As empresas que usam recursos de OCR para converter imagens e PDFs — normalmente vindos de documentos em papel digitalizados — economizam tempo e recursos que, de outra forma, seriam necessários para gerenciar dados não pesquisáveis. Depois de transferidas, as informações textuais processadas pelo OCR podem ser usadas pelas empresas com mais facilidade e rapidez.
Com informação: Hy land, Doc Parser.