Cómo instalar un programa OCR en Debian

Programa OCR en Debian

Ultimamente me he puesto a digitalizar varias cantidades de documentos que tenía por casa. Documentos que me ocupan espacio y que necesito liberar pero no quiero perder. Es por ello que buscando por internet encontré una solución basada en un programa OCR y la cámara del smartphone.

Con la cámara del smartphone fotografiaría el documento y luego pasaría un programa OCR a la imagen para crear el documento de texto y poder utilizarlo y guardarlo en el ordenador. Pero ¿que programa usar para el reconocimiento OCR en Debian u otra distribución Gnu/Linux?

Navegando por Internet encontré varias webs que hablaban de este tipo de programas. En Gnu/Linux, un programa OCR está compuesto por el motor de reconocimiento y la interfaz. En cuánto a motor de reconocimiento, existe uno muy bueno llamado tesseract-ocr (personalmente lo probé y funciona muy bien) que es el que utilizaremos y la interfaz, en este caso, escogeremos gImageReader, que posee una interfaz bastante amigable para todo tipo de usuarios.

Así pues, para instalarlo abrimos una terminal y escribimos lo siguiente:

sudo aptitude install tesseract-ocr tesseract-ocr-spa gimagereader

Una vez que termine la instalación, hemos de ejecutar gImageReader y ya está listo para usar. Solo hemos de seleccionar la imagen o lote de imágenes que queremos digitalizar y pulsar la opción que está en la parte superior llamada «Recognize All». Esto hará que comience el reconocimiento de caracteres del documento y lo porta a un documento txt que podremos abrir con cualquier editor de texto.

La interfaz de gImageReader es muy intuitiva y fácil de usar, por lo que el uso del programa OCR es muy fácil y rápido, haciendo muy fácil la tarea de digitalizar documentos de texto.

Claro está, si tenemos documentos aislados, hemos de ir imagen tras imagen pues si lo hacemos como lote de imágenes, crearíamos un único documento txt con todo el texto de los documentos. En cualquier caso, no hay ya excusa para tener nuestros documentos de texto en formato digital ¿no creéis?


Deja tu comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

*

*

  1. Responsable de los datos: AB Internet Networks 2008 SL
  2. Finalidad de los datos: Controlar el SPAM, gestión de comentarios.
  3. Legitimación: Tu consentimiento
  4. Comunicación de los datos: No se comunicarán los datos a terceros salvo por obligación legal.
  5. Almacenamiento de los datos: Base de datos alojada en Occentus Networks (UE)
  6. Derechos: En cualquier momento puedes limitar, recuperar y borrar tu información.

  1.   Diego Retero dijo

    Usar la cámara del móvil para escanear es una pésima idea, cómprate el escáner más barato y te va a dar mejores resultados que el móvil más caro del mercado

  2.   Daniel dijo

    Muy bueno, supongo que también corre en Ubuntu y derivados. hay que probarlo. Saludos.

  3.   DaBry.O.Díaz dijo

    Muchas gracias!… ¡Este Programa gImageReader es realmente Genial! Me fue de mucha Utilidad en mi Linux-Debian-Q4OS lo estaba necesitando con mucha urgencia; para poder digitalizar unas imágenes, de un Manual de Convivencia, en un Conjunto Residencial; que estaba en Papel desde hace 20 años, y había que actualizarlo! Primero Scanee todo el documento, página por página, con un Scanner de una Impresora Epsom; y luego con los archivos de imagen, pude editar y corregir muy fácil y directamente cada texto en el mismo programa; de allí me genero sencillos documentos texto plano, y ya con esto finalmente copie, pegue y hice edición final y correcciones con el Editor de Texto enriquecido de Libre Office. gImageReader en Verdad muy Útil y bueno…Nuevamente muchas gracias y Bendiciones…Atentamente: DaBry.O.Díaz