Digitalização facilitada com OCR e ICR

Digitalizar e armazenar documentos digitalmente com a ajuda de OCR e ICR

Embora a digitalização esteja a avançar, ainda hoje as empresas têm uma grande variedade de documentos disponíveis apenas em formato manuscrito ou dactilografado. O Reconhecimento Óptico de Caracteres (OCR) e o Reconhecimento Inteligente de Caracteres (ICR) proporcionam aqui um remédio e muitas novas possibilidades para simplificar os processos.

A digitalização está a progredir, mas o que está a ser feito com documentos convencionais, que até agora só estavam disponíveis por escrito? Mesmo que talvez já tenham sido digitalizados, muitas vezes permanecem indecifráveis porque consistem apenas em gráficos rasterizados unidos.

Mesmo a melhor resolução é inútil se o texto não for editável pelo computador. E depois há as notas manuscritas, tais como actas de reuniões ou transcrições, que em última análise têm de ser laboriosamente transferidas para o sistema digital. Então, o que fazer?

A dactilografia foi ontem, hoje é OCR.

No caso de modelos que só existem de forma aleatória, tais como ficheiros e documentos antigos, o software de digitalização com OCR pode ajudá-lo a criar texto editável a partir de um modelo de imagem. Documentos fotografados ou outros ficheiros baseados em pixéis também podem ser capturados. Para isso, é necessário um software de reconhecimento de texto e um motor de OCR completo, como o da KADMOS, ABBYY, etc.

O que é o OCR?

OCR significa “Optical Character Recognition” (Reconhecimento Óptico de Caracteres) e, portanto, um processo que gera um texto a partir do modelo de imagem por meio de scan, padrão e esquema de cálculo. Isto é feito utilizando um scanner normal. Posteriormente, o modelo gerado desta forma é carregado no programa de reconhecimento de texto. O motor de OCR analisa agora a imagem em relação aos seus componentes, de modo a poder reconhecer facilmente que parte do documento digitalizado é a imagem, que texto. Este passo é muito importante para a montagem posterior.

Agora as partes que foram reconhecidas como texto são comparadas com os padrões e propriedades disponíveis no programa. Será que esta acumulação de pixels corresponde mais a um símbolo ou a uma letra? A avaliação da análise por diferentes algoritmos torna possível uma tal decisão para o computador. Assim, o programa reconhece o texto linha a linha e finalmente remonta o documento de acordo com a análise inicial. A imagem tornou-se um documento editável e pesquisável. O documento é então guardado como desejado em formato PDF, DOC ou outro formato de ficheiro.

Reconhecimento escrito à mão graças ao ICR

O ICR (Intelligent Character Recognition) é o desenvolvimento lógico do OCR. Esta é uma análise e avaliação detalhada do resultado do scan, também no que diz respeito ao contexto semântico. Isto significa que depois de um conteúdo de imagem ter sido capturado, não só é separado em texto e imagem, mas dentro do texto é também analisado se é razoável utilizar esta letra em termos de conteúdo. Especialmente com caracteres de aspecto semelhante como “8” ou “B”, esta técnica melhorou muito a precisão do reconhecimento digital do texto. Mesmo que os originais já apresentem cartas desbotadas devido à idade, estas podem muitas vezes ser reconhecidas e digitalizadas sem qualquer problema, graças ao ICR.
Uma grande área para o ICR é o reconhecimento de textos escritos à mão, o que tem sido frequentemente um problema para o software de reconhecimento de textos. Com o ICR integrado, no entanto, é também possível digitalizá-los sem qualquer problema.

Aplicações para OCR e ICR

Em tempos de rede, a recuperação digital da informação na sua própria rede da empresa é tão importante como nos documentos arquivados. Através de software de reconhecimento de texto, que integrou o OCR e o ICR, é possível proteger os arquivos em papel existentes e os seus importantes conteúdos da decomposição e torná-los legalmente acessíveis a longo prazo. Isto também se aplica a documentos históricos em Fraktur script!

OCR/ICR também pode ser utilizado para simplificar os processos de triagem, por exemplo, para correio de entrada ou em caixas de entrada administrativas. Aqui, as características dos envelopes e/ou embalagens podem ser reconhecidas e depois transferidas para sistemas de triagem existentes. O reconhecimento e pesquisa de texto completo torna possível o processamento e o reconhecimento completo de documentos. Isto aplica-se a documentos estruturados tais como formulários, receitas e formulários de transferência bancária, bem como a textos semi-estruturados tais como facturas ou notas de entrega ou mesmo textos contínuos sem estruturação – tais como cartas de reclamação e outro correio de entrada. Todos estes tipos de documentos também podem ser capturados a partir de uma nuvem – OCR fornece um apoio positivo para a ligação em rede dos seus processos. O tempo poupado é considerável e a redução de erros em comparação com a captura manual é também impressionante.

No departamento de contabilidade ou mesmo na organização, o software de captura de texto pode ser utilizado para digitalizar automaticamente documentos e transferir automaticamente os dados obtidos para os programas apropriados para processamento posterior. Desta forma, os erros de dactilografia podem ser minimizados e o arquivamento de documentos importantes é feito ao mesmo tempo.

Especialmente na era digital, também se pode beneficiar da tecnologia na área móvel. Relatórios e formulários de despesas de viagem podem ser reconhecidos e processados mais tarde. As leituras dos contadores, por exemplo, de aquecedores, contadores de água ou similares também podem ser fotografadas e depois enviadas para processamento posterior no próprio processo da empresa.

Na área cada vez mais estabelecida da Indústria 4.0, tecnologias como a tecnologia OCR permitem que a informação seja capturada a partir de ecrãs e máquinas sem interrupção. Evitam-se, assim, tempos de arranque e de espera dispendiosos. A sua produção pode continuar e continua a receber sem dificuldades as informações e factos de que necessita.

A utilização de kits de software OCR/ICR de um fornecedor de TI no sector farmacêutico tem sido particularmente bem sucedida. Aqui, vários milhões de prescrições e receitas médicas em toda a Alemanha foram importadas por máquina. A taxa de erro permaneceu abaixo dos 5%. Ao ler nas receitas no balcão, centenas de horas-homem foram poupadas e o processo de digitalização foi consideravelmente optimizado.

Torna-se assim evidente que o software OCR/ICR irá conduzir cada vez mais à digitalização de documentos analógicos.

    Chief Executive Officer der KADMOS GmbH, einem der weltweit führenden Unternehmen im Bereich von Schriftenerkennung OCR und ICR, mit über 20 Jahren Management Erfahrung in internationalen Dokumenten Management und Capture Unternehmen.

    Comentários estão fechados.

    This website uses cookies to improve your experience. We'll assume you're ok with this, but you can opt-out if you wish. Accept Read More