Jak nainstalovat program OCR na Debian

OCR program v Debianu

V poslední době digitalizuji několik dokumentů, které jsem měl doma. Dokumenty, které zabírají místo a které musím uvolnit, ale nechci je ztratit. Proto jsem hledal na internetu, který jsem našel řešení založené na programu OCR a fotoaparátu smartphonu.

S fotoaparátem smartphonu Fotografoval bych dokument a poté spustil program OCR k obrazu vytvořit textový dokument tak, aby jej bylo možné použít a uložit do počítače. Ale Jaký program použít pro rozpoznávání OCR v Debianu nebo jiné distribuci Gnu / Linux?

Při procházení Internetu jsem našel několik webů, které hovořily o tomto typu programu. V Gnu / Linux je program OCR tvořen rozpoznávacím modulem a rozhraním. Pokud jde o rozpoznávací modul, existuje velmi dobrý s názvem tesseract-ocr (Osobně jsem to otestoval a funguje to velmi dobře), což je ten, který použijeme, a rozhraní, v tomto případě, vybereme gImageReader, který má velmi přátelské rozhraní pro všechny typy uživatelů.

Abychom jej nainstalovali, otevřeme terminál a napíšeme následující:

sudo aptitude install tesseract-ocr tesseract-ocr-spa gimagereader

Po dokončení instalace Musíme spustit gImageReader a je připraven k použití. Musíme jen vybrat obrázek nebo dávku obrázků, které chceme digitalizovat, a stisknout možnost nahoře s názvem „Rozpoznat vše“. Tím se spustí rozpoznávání znaků dokumentu a Přenáší jej do dokumentu txt, který můžeme otevřít v libovolném textovém editoru.

Rozhraní gImageReader je velmi intuitivní a snadno použitelné, takže použití programu OCR je velmi snadné a rychlé, což usnadňuje digitalizaci textových dokumentů.

Samozřejmě, pokud máme izolované dokumenty, musíme jít obraz po obrázku, protože pokud to uděláme jako dávku obrázků, vytvořili bychom jeden dokument txt se všemi texty dokumentů. V každém případě již neexistuje výmluva, abychom měli naše textové dokumenty v digitálním formátu Nemyslíte si?


Zanechte svůj komentář

Vaše e-mailová adresa nebude zveřejněna. Povinné položky jsou označeny *

*

*

  1. Za data odpovídá: AB Internet Networks 2008 SL
  2. Účel údajů: Ovládací SPAM, správa komentářů.
  3. Legitimace: Váš souhlas
  4. Sdělování údajů: Údaje nebudou sděleny třetím osobám, s výjimkou zákonných povinností.
  5. Úložiště dat: Databáze hostovaná společností Occentus Networks (EU)
  6. Práva: Vaše údaje můžete kdykoli omezit, obnovit a odstranit.

  1.   Diego Retero řekl

    Používat mobilní kameru ke skenování je špatný nápad, kupte si nejlevnější skener, který vám poskytne lepší výsledky než nejdražší mobilní telefon na trhu

  2.   Daniel řekl

    Velmi dobře, předpokládám, že také běží na Ubuntu a derivátech. musíte to zkusit. Pozdravy.

  3.   DaBry.O.Diaz řekl

    Mnohokrát děkuji!… Tento program gImageReader je opravdu skvělý! Bylo to pro mě velmi užitečné na mém Linux-Debian-Q4OS. Potřeboval jsem to velmi naléhavě; umět digitalizovat některé obrázky z příručky o koexistenci v obytném komplexu; to bylo na papíře 20 let a muselo to být aktualizováno! Nejprve naskenujte celý dokument, stránku po stránce, pomocí skeneru tiskárny Epsom; a pak pomocí obrazových souborů jsem byl schopen upravovat a opravovat každý text velmi snadno a přímo ve stejném programu; Odtamtud generuji jednoduché dokumenty ve formátu prostého textu a díky tomu jsem je nakonec zkopíroval, vložil a provedl konečné úpravy a opravy pomocí editoru RTF Libre Office. gImageReader opravdu velmi užitečný a dobrý ... Ještě jednou moc děkuji a požehnání ... S pozdravem: DaBry.O.Díaz