Cách cài đặt chương trình OCR trên Debian

Chương trình OCR trong Debian

Gần đây, tôi đã số hóa một số lượng tài liệu mà tôi có ở nhà. Tài liệu chiếm dung lượng và tôi cần giải phóng nhưng không muốn mất. Đó là lý do tại sao khi tìm kiếm trên Internet, tôi đã tìm thấy một giải pháp dựa trên chương trình OCR và camera của điện thoại thông minh.

Với camera của điện thoại thông minh Tôi sẽ chụp ảnh tài liệu và sau đó chạy chương trình OCR cho hình ảnh để tạo tài liệu văn bản để có thể sử dụng và lưu trên máy tính. Nhưng Chương trình nào để sử dụng để nhận dạng OCR trên Debian hoặc bản phân phối Gnu / Linux khác?

Duyệt Internet, tôi tìm thấy một số trang web nói về loại chương trình này. Trong Gnu / Linux, một chương trình OCR được tạo thành từ công cụ nhận dạng và giao diện. Đối với công cụ nhận dạng, có một cái rất hay gọi là tesseract-ocr (Cá nhân tôi đã thử nghiệm nó và nó hoạt động rất tốt) đó là giao diện chúng tôi sẽ sử dụng và giao diện, trong trường hợp này, chúng tôi sẽ chọn gImageReader, có giao diện rất thân thiện cho mọi đối tượng người dùng.

Vì vậy, để cài đặt nó, chúng tôi mở một thiết bị đầu cuối và viết như sau:

sudo aptitude install tesseract-ocr tesseract-ocr-spa gimagereader

Sau khi cài đặt xong, Chúng tôi phải chạy gImageReader và nó đã sẵn sàng để sử dụng. Chúng tôi chỉ cần chọn hình ảnh hoặc hàng loạt hình ảnh mà chúng tôi muốn số hóa và nhấn tùy chọn ở trên cùng có tên là "Recognize All". Điều này sẽ bắt đầu nhận dạng ký tự của tài liệu và Chuyển nó vào một tài liệu txt mà chúng tôi có thể mở bằng bất kỳ trình soạn thảo văn bản nào.

Giao diện gImageReader rất trực quan và dễ sử dụng nên việc sử dụng chương trình OCR rất dễ dàng và nhanh chóng, thực hiện công việc số hóa tài liệu văn bản rất dễ dàng.

Tất nhiên, nếu chúng ta có các tài liệu riêng biệt, chúng ta phải chuyển hết ảnh này sang ảnh khác vì nếu chúng tôi làm điều đó dưới dạng một loạt hình ảnh, chúng tôi sẽ tạo một tài liệu txt duy nhất với tất cả nội dung của tài liệu. Trong mọi trường hợp, không còn lý do gì để có các tài liệu văn bản của chúng tôi ở định dạng kỹ thuật số Bạn có nghĩ vậy không?


Để lại bình luận của bạn

địa chỉ email của bạn sẽ không được công bố. Các trường bắt buộc được đánh dấu bằng *

*

*

  1. Chịu trách nhiệm về dữ liệu: AB Internet Networks 2008 SL
  2. Mục đích của dữ liệu: Kiểm soát SPAM, quản lý bình luận.
  3. Hợp pháp: Sự đồng ý của bạn
  4. Truyền thông dữ liệu: Dữ liệu sẽ không được thông báo cho các bên thứ ba trừ khi có nghĩa vụ pháp lý.
  5. Lưu trữ dữ liệu: Cơ sở dữ liệu do Occentus Networks (EU) lưu trữ
  6. Quyền: Bất cứ lúc nào bạn có thể giới hạn, khôi phục và xóa thông tin của mình.

  1.   Diego Retero dijo

    Sử dụng máy ảnh di động để quét là một ý tưởng tồi, hãy mua cho mình một máy quét rẻ nhất và nó sẽ cho bạn kết quả tốt hơn so với thiết bị di động đắt tiền nhất trên thị trường

  2.   Daniel dijo

    Rất tốt, tôi cho rằng nó cũng chạy trên Ubuntu và các dẫn xuất. Bạn phải thử nó. Lời chào hỏi.

  3.   DaBry.O.Diaz dijo

    Cảm ơn bạn rất nhiều!… Chương trình gImageReader này thực sự tuyệt vời! Nó rất hữu ích trên Linux-Debian-Q4OS của tôi, tôi đang rất cần nó; để có thể số hóa một số hình ảnh, từ Sổ tay hướng dẫn Chung sống, trong Khu dân cư phức hợp; đó là trên giấy trong 20 năm, và phải được cập nhật! Đầu tiên Quét toàn bộ tài liệu, từng trang, bằng Máy quét Máy in Epsom; và sau đó với các tệp hình ảnh, tôi có thể chỉnh sửa và sửa từng văn bản rất dễ dàng và trực tiếp trong cùng một chương trình; Từ đó, tôi tạo các tài liệu văn bản thuần túy đơn giản, và với tài liệu này, cuối cùng tôi đã sao chép, dán và thực hiện các chỉnh sửa cũng như chỉnh sửa lần cuối với Rich Text Editor của Libre Office. gImageReader thực sự rất hữu ích và tốt ... Cảm ơn bạn một lần nữa và Chúc phúc ... Trân trọng: DaBry.O.Díaz