Los programas de reconocimiento óptico de caracteres (OCR en inglés) son una parte importante de un sistema de gestión documental. Utilizados correctamente son de gran ayuda en el trabajo de clasificación y búsqueda de documentos pero en muchas ocasiones generan gran frustración en los usuarios que los instalan. Como en tanto otros aspectos, la felicidad no está en lo que tienes (en lo que el programa hace) si no en lo que deseas (lo que esperabas que hiciera). Muchos comerciales, sea por desconocimiento o por sus propios intereses, venden soluciones de gestión documental con un OCR que hace auténtica magia y cuando el sistema se instala el usuario queda decepcionado de la aplicación real del OCR a sus problemas de digitalización, muy por debajo de sus expectativas.
Qué hace (bien) un (buen) OCR
Un OCR convierte un documento electrónico en formato «imagen» (una foto) en un texto que se puede guardar en un documento Word, Txt, Excel… en el que podemos editar el texto, copiarlo y usarlo para buscar el propio documento a partir de las palabras que forman el texto. Transforma la «foto» de un texto escrito en «palabras», en frases que forman un documento editable.
Un contrato en papel, por ejemplo, se puede convertir en un documento Word que puedo modificar para redactar un nuevo contrato o del que puedo copiar cualquier párrafo. De una tarjeta de visita, en papel, puedo obtener el nombre, dirección, teléfono, correo electrónico… para incorporarlo a mi base de datos de clientes, o amigos. Un documento en PDF no editable (que no es más que una imagen TIFF incrustrada en un PDF, por más que parezca un texto) se puede convertir en un PDF de texto en el que sí podremos copiar el contenido y utilizarlo como texto en cualquier otro documento. Además podremos buscarlo por las palabras contenidas en el texto.
Esto es lo que hace un OCR. No es poco y tiene aplicación directa en muchas tareas frecuentes. Desde el punto de vista de la gestión documental quizás lo más interesante es que nos permite incorporar documentos de texto en los que todas las palabras del documento sirven para realizar búsquedas. Es una gran ventaja ya que nos ahorra la necesidad de añadir etiquetas adicionales a los documentos para asegurar que los encontraremos más adelante utilizando estas palabras añadidas.
Y qué podemos conseguir con un OCR Zonal (que sea muy bueno)
Algunos OCR permiten definir zonas rectangulares de un documento para que el programa de reconocimiento sepa que en esa parte concreta del papel hay unos datos específicos que me interesan. Por ejemplo, el destinatario de una factura. O el código de un albarán. Con esa información, ya en formato texto, se puede automatizar la clasificación de los documentos que escaneamos.
El OCR «por sí mismo» no clasifica documentos. Simplemente añade información en formato texto que podemos utilizar, por ejemplo, para darle el nombre al documento de forma automática o incorporar como «metadatos» que acompañan al propio documento. Luego, con esos datos adicionales, otro proceso diferente puede utilizar esa información para realizar algún proceso, sea la clasificación automática o la incorporación de los datos en los campos adecuados de una base de datos documental.
Qué NO hace (bien) un OCR
Adivinar de una forma casi mágica el contenido de cualquier documento y clasificarlo automáticamente en su carpeta correspondiente. Esta es la mayor decepción de muchos usuarios al instalar algunos programas que prometen ahorros importantes en la digitalización de documentos.
Aunque la incorporación de datos adicionales a los documentos digitalizados nos permite automatizar algún proceso, como la clasificación automática, la aplicación práctica no es nada sencilla.
El principal problema al utilizar un OCR zonal es que cada tipo de documento requiere que definamos una plantilla específica que indique al programa dónde están los datos que me interesan. En la mayoría de las empresas la variedad de documentos a escanear es muy elevada y la repetición de documentos con el mismo formato «visual» muchas veces no justifica el tiempo necesario para crear cada plantilla.
Además, cada documento debe asociarse a alguna carpeta concreta que puede cambiar con el tiempo o, directamente, no existir en un principio.
En definitiva, hay un proceso de configuración de plantillas y carpetas que requiere bastante tiempo y que solo está justificado si los documentos se repiten con frecuencia, algo que no suele pasar en las empresas pequeñas.
Sumemos a este problema los errores propios del propio reconocimiento (ningún OCR acierta el 100% de los textos reconocidos) y tenemos un sistema complejo y laborioso que con frecuencia no consigue un ahorro significativo de tiempos.
Algunos programas sí hacen magia
Hay aplicaciones muy interesantes en procesamiento de documentos que consiguen extraer información estructurada de textos. Por ejemplo, en MTC Soft hemos desarrollado un analizador de notas simples del Registro de la Propiedad que recuperan la información de una finca: descripción, titulares, cargas… o de documentos notariales (compraventas, constituciones de sociedad…) que analizan el texto y consiguen identificar cientos de datos interesantes. Pero esto NO es un OCR.
Con frecuencia los documentos a analizar están en papel por lo que el primer paso es digitalizarlos y pasarles el OCR para convertirlos en documentos Word, editables. Pero la utilización del OCR no tiene nada que ver con el propio análisis del contenido. Es un paso necesario cuando partimos de un documento en papel, como lo es el proceso de digitalización, pero la «inteligencia» del programa que le permite encontrar datos estructurados no tienen nada que ver con el OCR.
Utilizando esta técnica de análisis de textos se pueden añadir metadatos a los documentos y, a partir de ellos, tomar decisiones en cuanto a su clasificación, tanto del propio documento como de los datos estructurados encontrados «dentro» de él.
¿Tiene alguna pega? La misma que comentaba respecto a los OCR zonales: solo tiene sentido este proceso para documentos que se reciben con frecuencia. Configurar un programa de análisis lingüístico para que encuentre la información que me interesa requiere un esfuerzo importante y solo al alcance de programadores. No es algo que pueda hacer el cliente como parte del proceso de configuración de un nuevo programa.
Por tanto, su uso queda limitado a instalaciones que procesan muchos documentos de un determinado tipo que justifiquen el esfuerzo de preparación necesario para configurar cada tipo de documento.
En resumen, el OCR es una herramienta muy útil para cualquier sistema de gestión documental pero no hace magia sin un proceso de configuración muy laborioso y bastante complejo. Si tu necesidad responde al perfil adecuado, muchos documentos del mismo tipo y formato, la inversión merecerá la pena. Si no es así, hay que limitarse a pasar el OCR a documentos completos e indexar por el contenido completo y clasificar manualmente.
Deja una respuesta