如何在Debian上安装OCR程序

Debian中的OCR程序

最近,我一直在数字化自己在家中的一些文件。 占用空间且我需要释放但又不想丢失的文档。 这就是为什么搜索我发现的互联网 基于OCR程序和智能手机摄像头的解决方案。

使用智能手机相机 我将拍摄文档,然后对图像运行OCR程序 创建文本文档,以便可以在计算机上使用和保存该文本文档。 但 在Debian或其他Gnu / Linux发行版上,用于OCR识别的程序是什么?

浏览互联网时,我发现了几个谈论这种程序的网站。 在Gnu / Linux中,OCR程序由识别引擎和接口组成。 至于识别引擎, 有一个非常好的叫tesseract-ocr的 (我亲自对其进行了测试,并且效果很好),这是我们将要使用的接口,在这种情况下, 我们将选择gImageReader,它对所有类型的用户都具有非常友好的界面。

因此,要安装它,我们打开一个终端并输入以下内容:

sudo aptitude install tesseract-ocr tesseract-ocr-spa gimagereader

安装完成后, 我们必须运行gImageReader并准备使用它。 我们只需要选择要数字化的图像或一批图像,然后按顶部的“全部识别”即可。 这将开始文档的字符识别,并 将其移植到我们可以使用任何文本编辑器打开的txt文档中.

gImageReader界面非常直观且易于使用,因此使用OCR程序非常容易且快速,这使得对文本文档进行数字化的任务非常容易。

当然,如果我们有孤立的文档,我们必须一个接一个地处理图像,因为 如果我们将其作为一批图像进行处理,则将使用文档的所有文本创建一个txt文档。 无论如何,不​​再有任何借口让我们的文本文档为数字格式 你不认为?


本文内容遵循我们的原则 编辑伦理。 要报告错误,请单击 信息.

3条评论,留下您的评论

发表您的评论

您的电子邮件地址将不会被发表。 必填字段标有 *

*

*

  1. 负责资料:AB Internet Networks 2008 SL
  2. 数据用途:控制垃圾邮件,注释管理。
  3. 合法性:您的同意
  4. 数据通讯:除非有法律义务,否则不会将数据传达给第三方。
  5. 数据存储:Occentus Networks(EU)托管的数据库
  6. 权利:您可以随时限制,恢复和删除您的信息。

  1.   迭戈·雷特罗(Diego Retero)

    使用移动相机进行扫描不是一个好主意,请购买最便宜的扫描仪,相比市面上最昂贵的移动设备,它会为您带来更好的结果

  2.   丹尼尔

    很好,我想它也可以在Ubuntu和衍生产品上运行。 您必须尝试一下。 问候。

  3.   达布里·奥迪亚兹

    非常感谢!...这个gImageReader程序真的很棒! 它在我非常迫切需要它的 Linux-Debian-Q4OS 上对我非常有用; 能够将住宅综合体中共存手册中的一些图像数字化; 那是在纸上写了 20 年,必须更新! 首先使用 Epsom 打印机扫描仪逐页扫描整个文档; 然后使用图像文件,我能够非常轻松直接地在同一程序中编辑和更正每个文本; 从那里我生成了简单的纯文本文档,最后我用 Libre Office 的富文本编辑器复制、粘贴并进行了最终编辑和更正。 gImageReader 真的非常有用和好......再次感谢你和祝福......真诚的:DaBry.O.Díaz