Los programas de reconocimiento óptico de caracteres, abreviados habitualmente por OCR (por Optical character recognition) son un clásico del software genérico pero no todo el mundo los conoce ni los aprovecha como merecen.
Convertir un documento en papel en un fichero Word o una hoja Excel, editable, es decir, que nos permite corregir el texto y copiar frases o párrafos, es muy útil en muchos casos. En la práctica no se utilizan con la frecuencia que cabría esperar, en parte por desconocimiento, por el hecho de tener que pagar una cantidad extra por un programa más o menos exótico (para un usuario de a pie) y en buena parte porque somos poco tolerantes a los errores de las máquinas: si el resultado no es prácticamente perfecto, se desprecia la herramienta (esto mismo ocurre con los traductores automáticos, pero esa es otra historia y otro blog).
Pero, centrándonos en la gestión documental, el uso de los OCR sí que tiene un sitio muy claro en el que aprovechar sus ventajas: en el «indexado» de los documentos que se escanean (o digitalizan, que nunca sé qué palabra usar), que es otra de las 5 patas… (ya solo queda una).
Para los programadores, indexar es ordenar una base de datos utilizando un campo (o un conjunto de ellos), como ordenar una lista de clientes por el apellido. Pero para los documentalistas, indexar es añadir información alfanumérica a una imagen de un documento.
Con un ejemplo, que es el recurso de los torpes y por tanto lo uso mucho, se entiende perfectamente.
Tengo un montón de facturas de gastos que introducir en mi programa de gestión documental. El escáner me proporciona una imagen (en formato PDF por ejemplo) de cada factura. Pero necesito más información para ordenarlas y poderlas localizar luego. En esta caso, la persona que digitaliza las facturas graba cada una de ellas con el número de factura y el año, una información única para cada una de ellas. Si quiero tener más opciones de búsqueda, también introduciría el nombre del proveedor, la fecha y, por ejemplo, la cantidad total pagada.
Cada uno de estos datos me ayudará en el futuro a localizar el documento pero, y es un pero muy importante, cada dato que introduzco tiene un coste en tiempo de proceso. Si voy a digitalizar un almacen con decenas de miles de facturas en papel, cualquier incremento en el tiempo empleado por cada factura supondrá un incremento en el tiempo, y coste, del proceso de digitalización, un coste que hay que multiplicar por 10 ó 20 ó 40 mil.
Y aquí entra, ¡por fin!, el software de reconocimiento de caracteres. Los programas más sencillos simplemente reconocen todo el texto, generando un fichero Word, Excel, PDF de texto… lo que es un gran avance porque podré «indexar» todo el contenido del fichero ampliando mis opciones de búsqueda.
Pero para la introducción de la información de una forma sistemática y estructurada, campos concretos como los comentados antes, lo ideal es disponer de un OCR ZONAL, un programa que me permite delimitar ciertas zonas del documento (normalmente rectangulares) en las que se realizará el proceso de reconocimiento porque esperamos encontrar allí determinada información. Por ejemplo, el número y fecha de una factura, o el nombre del proveedor, o el notario de una escritura…
Obviamente la utilización de estos programas está indicada para grandes volúmenes de documentos con un formato conocido y repetido que compensa la creación de estas «zonas» con la repetición de miles de operaciones.
Para documentos variados y no muy numerosos, el OCR genérico (que suele venir incluido en los escáneres) puede ser suficiente y ya es una opción de cada documento el utilizarlo y guardarlo como texto para mejorar las búsquedas y la capacidad de editar el documento, o no usarlo y guardar simplemente la imagen, lo más habitual para documentos que solo queremos conservar como una fotocopia del original.
Eso sí, no intentéis «reconocer» un texto escrito a mano; eso es otra historia (y otro coste).
Hola Fernando.
Nos conocemos pero no sé si me recuerdas de Documadrid 2009. También me llamo Fernando y soy de Sicubo.
Enhorabuena por el Blog.
Aprovecho este artículo para contactar contigo porque al hablar de OCR zonal no sé si disponéis de algún producto en esta línea o si trabajáis con algún proveedor en esto.
Nosotros somos fabricantes de software de digitalización y disponemos de un sistema de OCR zonal propio del que estamos muy orgullosos.
Si quieres conocer nuestro producto o quieres verlo funcionar ponte en contacto conmigo y vemos si podemos colaborar.
Un afectuoso saludo.
Si eres Fernando López de Cáceres, te recuerdo perfectamente y parte de los comentarios sobre OCRs zonales se refieren a vuestro producto.
Me parece que podríamos colaborar porque nuestros productos son muy complementarios.
Me puedes mandar un correo a direccion@mtcsoft.es y vemos cómo seguir adelante.
Me alegro que te guste el blog. Es complicado hacerlo sólo de gestión documental, pero aún me quedan cosas que contar.
Hola Fernando,
Despues de tiempo vuelvo a tu blog, por que estoy retomando la idea de abrir un negocio de gestión documental.
Por ahora te escribo para consultarte algunas cosas de las que estoy seguro tu tienes mucho conocimiento:
Imagino que una empresa de digitalización de documentos debe tener en sus equipos un programa OCR Zonal (para algun requerimiento especial de algún cliente) por lo tanto..cuáles existen en el mercado? cúal recomiendas tú? y cúanto es el costo de estos?
Esperando tu respuesta te envío un cordial saludo, te agradezco de antemano tu colaboración y te felicito por tu blog.
Denis
Hola Denis:
Conozco varios OCR zonales pero curiosamente no hemos usado ninguno de forma regular. Nuestros clientes, la mayoría PYMES, no dan el perfil, que es el de digitalización más o menos masiva y de documentos con una estructura repetitiva: facturas, albaranes, partes…
Tienen que ser muchos para que compense el trabajo inicial de definir una plantilla con los datos a recuperar.
En este mismo post puedes ver un comentario de una empresa española con un producto muy interesante: Sicubo.
Otra opción muy adecuada es ABBY fine reader. Usamos mucho la versión «básica» que viene con los escáneres Fujitsu. Tienen versiones mucho más complejas, incluyendo una «zonal». Creo que el precio es unos 400€, pero no estoy seguro porque hace tiempo que no hablo con ellos.
Kodak tiene un sofware muy profesional y potente, con multitud de opciones, incluyendo una API (para programadores) que permite integrarla con otras aplicaciones. Empieza en 450€ (si no recuerdo mal).
Hay otras opciones en el mercado pero no las conozco de primera mano.
Espero que si las pruebas y eliges alguna nos lo hagas saber. Aunque me has animado a escribir un post sobre el tema.
Un saludo.