Как установить программу распознавания текста в Debian

Программа OCR в Debian

В последнее время оцифровываю несколько документов, которые были у меня дома. Документы, которые занимают место и которые мне нужно освободить, но которые я не хочу терять. Вот почему, ища в Интернете, я нашел решение на основе программы OCR и камеры смартфона.

С камерой смартфона Я сфотографировал документ, а затем запустил программу распознавания текста для изображения. для создания текстового документа, чтобы его можно было использовать и сохранить на компьютере. Но Какую программу использовать для распознавания текста в Debian или другом дистрибутиве Gnu / Linux?

Просматривая Интернет, я нашел несколько веб-сайтов, на которых говорилось об этом типе программ. В Gnu / Linux программа OCR состоит из механизма распознавания и интерфейса. Что касается движка распознавания, есть очень хороший, называемый tesseract-ocr (Я лично пробовал это, и он работает очень хорошо), который мы будем использовать, и интерфейс, в данном случае, мы выберем gImageReader, который имеет очень удобный интерфейс для всех типов пользователей.

Итак, для его установки открываем терминал и пишем следующее:

sudo aptitude install tesseract-ocr tesseract-ocr-spa gimagereader

После завершения установки Нам нужно запустить gImageReader, и он готов к использованию. Нам нужно только выбрать изображение или пакет изображений, которые мы хотим оцифровать, и нажать кнопку вверху под названием «Распознать все». Это запустит распознавание символов документа и Перенесите его в текстовый документ, который мы можем открыть в любом текстовом редакторе..

Интерфейс gImageReader очень интуитивно понятен и прост в использовании, поэтому использовать программу OCR очень легко и быстро, что значительно упрощает задачу оцифровки текстовых документов.

Конечно, если у нас есть изолированные документы, мы должны переходить изображение за изображением, потому что если мы сделаем это как пакет изображений, мы создадим один текстовый документ со всем текстом документов. В любом случае больше нет оправдания тому, чтобы наши текстовые документы были в цифровом формате. Вы так не думаете?


3 комментариев, оставьте свой

Оставьте свой комментарий

Ваш электронный адрес не будет опубликован. Обязательные для заполнения поля помечены *

*

*

  1. Ответственный за данные: AB Internet Networks 2008 SL
  2. Назначение данных: контроль спама, управление комментариями.
  3. Легитимация: ваше согласие
  4. Передача данных: данные не будут переданы третьим лицам, кроме как по закону.
  5. Хранение данных: база данных, размещенная в Occentus Networks (ЕС)
  6. Права: в любое время вы можете ограничить, восстановить и удалить свою информацию.

  1.   Диего Ретеро сказал

    Использование камеры вашего мобильного телефона для сканирования - плохая идея, купите себе самый дешевый сканер, и он даст вам лучшие результаты, чем самый дорогой мобильный телефон на рынке.

  2.   Дэниел сказал

    Очень хорошо, я полагаю, он также работает на Ubuntu и производных. вы должны попробовать. Привет.

  3.   ДаБри.О.Диас сказал

    Большое спасибо!… Эта программа gImageReader действительно великолепна! Это было очень полезно на моем Linux-Debian-Q4OS, мне это было очень срочно нужно; уметь оцифровать некоторые изображения из Руководства по сосуществованию в жилом комплексе; это было на бумаге 20 лет, и его нужно было обновить! Сначала отсканируйте весь документ, страница за страницей, с помощью сканера Epsom Printer Scanner; а затем с файлами изображений я смог очень легко редактировать и исправлять каждый текст прямо в той же программе; Оттуда я генерирую простые текстовые документы, и с этим я, наконец, скопировал, вставил и сделал окончательное редактирование и исправления с помощью редактора Rich Text Editor в Libre Office. gImageReader действительно очень полезен и хорош ... Еще раз большое спасибо и Благословения ... С уважением: DaBry.O.Díaz