La digitalización es fácil con OCR e ICR

Digitalizar y almacenar documentos digitalmente con la ayuda de OCR e ICR

Aunque la digitalización está avanzando, aún hoy las empresas tienen una gran variedad de documentos que sólo están disponibles en forma manuscrita o mecanografiada. El reconocimiento óptico de caracteres (OCR) y el reconocimiento inteligente de caracteres (ICR) ofrecen un remedio en este sentido y muchas nuevas posibilidades para simplificar los procesos.

La digitalización avanza, pero ¿qué se hace con los documentos convencionales, que hasta ahora sólo estaban disponibles en forma escrita? Incluso si quizás ya han sido escaneados, a menudo permanecen inescrutables porque sólo consisten en gráficos rasterizados unidos.

Incluso la mejor resolución es inútil si el texto no es editable por la computadora. Y luego están las notas manuscritas, como las actas de las reuniones o las transcripciones, que en última instancia tienen que ser laboriosamente transferidas al sistema digital. Entonces, ¿qué hacer?

La mecanografía fue ayer, hoy es OCR.

En el caso de plantillas que sólo existen de forma háptica, como archivos y documentos antiguos, el software de escaneo con OCR puede ayudarle a crear un texto editable a partir de una plantilla de imagen. También se pueden capturar documentos fotografiados u otros archivos basados en píxeles. Para ello se necesita un software de reconocimiento de texto y un completo motor de OCR, como el de KADMOS, ABBYY, etc.

¿Qué es el OCR?

OCR significa «Optical Character Recognition» (reconocimiento óptico de caracteres) y, por lo tanto, es un proceso que genera un texto a partir de la plantilla de la imagen por medio de un escáner, un patrón y un esquema de cálculo. Esto se hace con un escáner normal. Después, la plantilla generada de esta manera se carga en el programa de reconocimiento de texto. El motor de OCR analiza ahora la imagen con respecto a sus componentes, para poder reconocer fácilmente qué parte del documento escaneado es imagen, qué texto. Este paso es muy importante para el montaje posterior.

Ahora las partes que han sido reconocidas como texto se comparan con los patrones y propiedades disponibles en el programa. ¿Esta acumulación de píxeles corresponde más a un símbolo o a una letra? La evaluación del análisis por diferentes algoritmos hace posible tal decisión para la computadora. Así, el programa reconoce el texto línea por línea y finalmente vuelve a ensamblar el documento según el análisis inicial. La imagen se ha convertido en un documento editable y con capacidad de búsqueda. El documento se guarda como se desee en un PDF, DOC u otro formato de archivo.

Reconocimiento manuscrito gracias al ICR

ICR (Intelligent Character Recognition) es el desarrollo lógico de la OCR. Se trata de un análisis y evaluación detallados del resultado del análisis, también en lo que respecta al contexto semántico. Esto significa que después de capturar el contenido de una imagen, no sólo se separa en texto e imagen, sino que dentro del texto también se analiza si es razonable utilizar esta carta en términos de contenido. Especialmente con caracteres de aspecto similar como el «8» o la «B», esta técnica ha mejorado mucho la precisión del reconocimiento digital de textos. Aunque los originales ya muestran letras descoloridas por la edad, éstas pueden ser reconocidas y digitalizadas sin problemas gracias al ICR.
Una gran área del ICR es el reconocimiento de textos escritos a mano, lo que a menudo ha sido un problema para los programas de reconocimiento de textos. Sin embargo, con el ICR integrado, también es posible digitalizarlos sin problemas.

Aplicaciones para OCR e ICR

En tiempos de redes, la recuperación digital de la información en la red de su propia empresa es tan importante como en los documentos archivados. Mediante el software de reconocimiento de textos, que ha integrado el OCR y el ICR, es posible proteger los archivos de papel existentes y los contenidos importantes que contienen de la descomposición y hacerlos legalmente accesibles a largo plazo. ¡Esto también se aplica a los documentos históricos en la escritura Fraktur!

El OCR/ICR también puede utilizarse para simplificar los procesos de clasificación, por ejemplo para el correo entrante o en los buzones administrativos. Aquí se pueden reconocer las características de los sobres y/o paquetes y luego transferirlas a los sistemas de clasificación existentes. El reconocimiento y la búsqueda de texto completo hace posible el procesamiento y el reconocimiento completo del documento. Esto se aplica a los documentos estructurados como formularios, recetas y formularios de transferencia bancaria, así como a los textos semiestructurados como facturas o notas de entrega, o incluso a los textos continuos sin estructurar, como las cartas de reclamación y otros correos entrantes. Todos estos tipos de documentos también pueden ser capturados desde una nube – el OCR proporciona un apoyo positivo para la conexión en red de sus procesos. El tiempo ahorrado es considerable y la reducción de errores en comparación con la captura manual también es impresionante.

En el departamento de contabilidad o incluso en la organización, el software de captura de texto puede utilizarse para escanear automáticamente los documentos y transferir automáticamente los datos obtenidos a los programas adecuados para su posterior procesamiento. De esta manera se pueden reducir al mínimo los errores de mecanografía y al mismo tiempo se archivan los documentos importantes.

Especialmente en la era digital, también puedes beneficiarte de la tecnología en el área de los móviles. Los informes y formularios de gastos de viaje pueden reconocerse y tramitarse posteriormente. Las lecturas de los medidores de, por ejemplo, calentadores, medidores de agua o similares también pueden ser fotografiadas y luego enviadas para su posterior procesamiento en el propio proceso de la empresa.

En el área cada vez más establecida de la Industria 4.0, tecnologías como la de OCR permiten capturar información de pantallas y máquinas sin interrupción. De esta manera se evitan los costosos tiempos de puesta en marcha y de espera. Su producción puede continuar y usted todavía recibe la información y los hechos que necesita sin dificultad.

El uso de los kits de software de OCR/ICR de un proveedor de tecnología de la información en el sector farmacéutico ha tenido un éxito especial. Aquí se han importado varios millones de recetas y recetas en toda Alemania a máquina. La tasa de error se mantuvo por debajo del 5%. Leyendo las recetas en el mostrador, se ahorraron cientos de horas-hombre y se optimizó considerablemente el proceso de digitalización.

Por lo tanto, se está haciendo evidente que el software OCR/ICR impulsará cada vez más la digitalización de documentos analógicos.

    Chief Executive Officer der KADMOS GmbH, einem der weltweit führenden Unternehmen im Bereich von Schriftenerkennung OCR und ICR, mit über 20 Jahren Management Erfahrung in internationalen Dokumenten Management und Capture Unternehmen.

    Los comentarios están cerrados.