最近、私は自宅に持っていたいくつかの量の文書をデジタル化しています。 スペースを取り、解放する必要があるが失いたくないドキュメント。 だから私が見つけたインターネットを検索する OCRプログラムとスマートフォンのカメラに基づくソリューション。
スマホカメラ付き ドキュメントを写真に撮ってから、画像に対してOCRプログラムを実行します テキストドキュメントを作成して、コンピュータで使用および保存できるようにします。 だが Debianまたは他のGnu / LinuxディストリビューションでOCR認識に使用するプログラムは何ですか?
インターネットを閲覧していると、このタイプのプログラムについて話しているWebサイトがいくつか見つかりました。 Gnu / Linuxでは、OCRプログラムは認識エンジンとインターフェースで構成されています。 認識エンジンは、 tesseract-ocrと呼ばれる非常に良いものがあります (私は個人的にそれをテストしました、そしてそれは非常にうまくいきます)これは私たちが使用するものであり、この場合はインターフェースです gImageReaderを選択します、すべてのタイプのユーザーにとって非常に使いやすいインターフェースを備えています。
したがって、それをインストールするには、ターミナルを開いて次のように記述します。
sudo aptitude install tesseract-ocr tesseract-ocr-spa gimagereader
インストールが完了したら、 gImageReaderを実行する必要があり、使用する準備が整いました。 デジタル化する画像または画像のバッチを選択し、上部にある[すべて認識]というオプションを押すだけです。 これにより、ドキュメントの文字認識が開始され、 任意のテキストエディタで開くことができるtxtドキュメントに移植します.
gImageReaderインターフェイスは非常に直感的で使いやすいため、OCRプログラムの使用は非常に簡単で高速であり、テキストドキュメントのデジタル化タスクが非常に簡単になります。
もちろん、ドキュメントを分離している場合は、画像を次々と移動する必要があります。 画像のバッチとして実行する場合、ドキュメントのすべてのテキストを含む単一のtxtドキュメントを作成します。 いずれにせよ、私たちのテキスト文書をデジタル形式にする言い訳はもうありません そう思いませんか?
モバイルカメラを使用してスキャンすることは悪い考えです。自分で最も安いスキャナーを購入すると、市場で最も高価なモバイルよりも良い結果が得られます。
とても良いです、私はそれがUbuntuと派生物でも動くと思います。 あなたはそれを試してみる必要があります。 ご挨拶。
どうもありがとうございました!…このgImageReaderプログラムは本当に素晴らしいです! それは私のLinux-Debian-Q4OSで私にとって非常に役に立ちました。私はそれを非常に緊急に必要としていました。 住宅団地内の共存マニュアルからいくつかの画像をデジタル化できるようにする。 それは20年間紙に書かれていて、更新する必要がありました。 まず、Epsomプリンタースキャナーを使用して、ドキュメント全体をページごとにスキャンします。 そして、画像ファイルを使用して、同じプログラムで各テキストを非常に簡単かつ直接編集および修正することができました。 そこから簡単なプレーンテキストドキュメントを生成し、これを使用して、LibreOfficeのRichText Editorを使用して、最終的にコピー、貼り付け、最終的な編集と修正を行いました。 gImageReaderは本当にとても便利で良いです...もう一度ありがとうと祝福...心から:DaBry.O.Díaz