如何在Debian上安裝OCR程序

Debian中的OCR程序

最近,我已經數字化了自己在家中的一些文件。 佔用空間且我需要釋放但又不想丟失的文檔。 這就是為什麼搜索我發現的互聯網 基於OCR程序和智能手機攝像頭的解決方案。

使用智能手機相機 我將拍攝文檔,然後對圖像運行OCR程序 創建文本文檔,以便可以在計算機上使用和保存該文本文檔。 但 在Debian或其他Gnu / Linux發行版上,用於OCR識別的程序是什麼?

瀏覽互聯網時,我發現了幾個談論這種程序的網站。 在Gnu / Linux中,OCR程序由識別引擎和接口組成。 至於識別引擎, 有一個非常好的叫tesseract-ocr的 (我親自對其進行了測試,並且效果很好),這是我們將要使用的接口,在這種情況下, 我們將選擇gImageReader,它對所有類型的用戶都具有非常友好的界面。

因此,要安裝它,我們打開一個終端並輸入以下內容:

sudo aptitude install tesseract-ocr tesseract-ocr-spa gimagereader

安裝完成後, 我們必須運行gImageReader並準備使用它。 我們只需要選擇要數字化的圖像或一批圖像,然後按頂部的“全部識別”即可。 這將開始文檔的字符識別,並 將其移植到我們可以使用任何文本編輯器打開的txt文檔中.

GImageReader界面非常直觀且易於使用,因此使用OCR程序非常容易且快速,使文本文檔數字化的任務非常容易。

當然,如果我們有隔離的文檔,則必須一個接一個地處理圖像,因為 如果我們將其作為一批圖像進行處理,則將使用文檔的所有文本創建一個txt文檔。 無論如何,不再有任何藉口讓我們的文本文檔為數字格式 你不認為?


發表您的評論

您的電子郵件地址將不會被發表。 必填字段標有 *

*

*

  1. 負責資料:AB Internet Networks 2008 SL
  2. 數據用途:控制垃圾郵件,註釋管理。
  3. 合法性:您的同意
  4. 數據通訊:除非有法律義務,否則不會將數據傳達給第三方。
  5. 數據存儲:Occentus Networks(EU)託管的數據庫
  6. 權利:您可以隨時限制,恢復和刪除您的信息。

  1.   迭戈·雷特羅(Diego Retero) 他說:

    使用移動相機進行掃描不是一個好主意,請購買最便宜的掃描儀,與市場上最昂貴的移動設備相比,它會為您帶來更好的結果

  2.   但以理書 他說:

    很好,我想它也可以在Ubuntu和衍生產品上運行。 您必須嘗試一下。 問候。

  3.   達布里·奧迪亞茲 他說:

    非常感謝!...這個gImageReader程序真的很棒! 它在我迫切需要的 Linux-Debian-Q4OS 上非常有用; 能夠將住宅綜合體中共存手冊中的一些圖像數字化; 那是在紙上寫了 20 年,必須更新! 首先使用 Epsom 打印機掃描儀逐頁掃描整個文檔; 然後使用圖像文件,我能夠在同一個程序中非常輕鬆直接地編輯和更正每個文本; 從那裡我生成簡單的純文本文檔,並最終使用 Libre Office 的富文本編輯器複製、粘貼並進行最終編輯和更正。 gImageReader 真的非常有用和好......再次感謝你和祝福......真誠的:DaBry.O.Díaz