Leyendo lo ilegible con superresolución e Inteligencia Artificial

Hoy en día se digitalizan cada vez más documentos que posteriormente se comparten y archivan. Y no es inusual que esto se haga por medio de una fotografía o escaneo. Sin embargo, una mala exposición, la falta de nitidez o una resolución insuficiente pueden perjudicar la legibilidad del documento, que no ofrece la calidad del original. Este problema puede resolverse, afortunadamente, con ayuda de inteligencia artificial.

La digitalización de documentos no debe afectar a su legilibilidad

Una parte fundamental de la transformación digital es la conversión de documentos en papel a formatos digitales como el PDF. Una vez digitalizado, el documento pueden archivarse, recuperarse, enviarse, recibirse y utilizarse en los procesos de trabajo diarios. Sin embargo, en algunos casos, el proceso de digitalización presenta dificultades. Por ejemplo, algunos documentos han sido excesivamente comprimidos para ahorrar espacio y coste de almacenaje. A menudo, esto se hace a expensas de la resolución del escaneo o foto. Cuando el documento se recupera del archivo, podemos encontramos con que el PDF es solo parcialmente legible. 
La situación no mejora si echamos manos de documentos digitalizados hace años o incluso décadas, cuando las posibilidades técnicas de escaneo eran más limitadas. Por ello, muchos documentos en baja resolución acababan en los archivos de todos los sectores. Por no hablar de los telefaxes que, por ejemplo, se almacenaban por lo general con una resolución de 98 dpi.
Pero tambien hoy: los documentos capturados con la cámara de móviles y tabletas pueden ser problemáticos. Suele ocurrir que los resultados son borrosos, tengan una perspectiva distorsionada o estén mal expuestos. Así, al ojo humano le resulta complicado leer el contenido con facilidad.

Para dar respuesta a este problema acude a nuestra a yuda la Superresolución con IA – un método de procesamiento de imágenes que explicamos a continuación.

La IA añade automáticamente información perdida

La superresolución es un proceso que analiza y optimiza automáticamente la calidad de las imágenes en documentos escaneados. El objetivo es conseguir una mayor resolución, esto es, un mayor tamaño y más nitidez de la imagen. En términos sencillos, la tarea básica del proceso de superresolución es rellenar los píxeles que faltan a los píxeles existentes. Para ello existen varios métodos que no se basan en Inteligencia artificial:

  • Método del “vecino más cercano”: copia el píxel original más cercano al borroso.
  • Interpolación bilineal: calcula la posición de los nuevos píxeles basándose en los píxeles vecinos
  • Interpolación bicúbica: determina el valor basándose en una función no lineal

Sin embargo, todos estos métodos tienen una limitación fundamental: siguen reglas comparativamente simples y son incapaces de añadir nueva información a una imagen. Aqui, el cerebro humano lleva claramente la delantera. Según el contexto, “imaginar” líneas nítidas o bucles cerrados de letras, por ejemplo. La buen anoticia es que la inteligencia artificial también es capaz de adquirir esta capacidad, siempre que se le entrene para ello. 

¿Cómo funciona la superresolución basada en IA?

La superresolución, o más exactamente la superresolución de imágenes, se basa en un modelo de aprendizaje automático que transforma de forma autónoma las imágenes de baja resolución en imágenes de alta resolución. Estos modelos pueden entrenarse reduciendo gradualmente la calidad de una imagen, inicialmente en alta resolución, hasta que sólo corresponda a la de un escaneo muy pobre. El algoritmo aprende entonces a invertir este proceso, es decir, a mejorar la calidad paso a paso. En el caso de los textos, este proceso de entrenamiento debe realizarse, por supuesto, teniendo en cuenta todos los tipos de letra habituales. Y se vuelve mucho más complicado (aunque no irreal) cuando se trata de procesar la escritura a mano. 

CIB IA

Superresolución: una ayuda imprescindible en la digitalización de documentos

Tanto si se trata de un documento antiguo recuperado del archivo, un escaneado con un tipo de letra demasiado pequeño o una foto borrosa del móvil, la superresolución (y nuestro producto CIB superResolution) puede mejorar significativamente la legibilidad de los documentos en muchos escenarios complicados y asegura, por tanto, la calidad y la legibilidad de información digitalizada. En nuestro CIB doXiview Showcase puede comprobar la funcionalidad con un documento ejemplar: Haga clic aquí

CIB investiga y desarrolla en el ámbito de varios proyectos para mejorar automáticamente la calidad de los documentos en base a múltiples enfoques. “Aprendizaje profundo de documentos con superresolución” ayuda a organizaciones y empresas a que los escaneos subóptimos sean más legibles, ampliándolos y agudizándolos de forma inteligente. En CIB también estamos evaluando enfoques como el auto-recorte y la auto-rotación (recortar, rotar y desestructurar automáticamente las páginas de los documentos), así como la detección de fraudes (detectar contenidos falsificados o manipulados). El objetivo es incorporar gradualmente los resultados de la investigación a nuestras soluciones para que en el futuro se pueda obtener una calidad óptima de los documentos incluso en casos extremadamente difíciles – aquellos en los que los datos estarían perdidos de forma irrevocable. CIB superResolution forma parte de las piezas imprescindibles a la hora de acometer procesos de digitalización a gran escala de forma eficiente y automatizada. 

Florian Deuring

Autor especialista en software y digitalización