V poslední době digitalizuji několik dokumentů, které jsem měl doma. Dokumenty, které zabírají místo a které musím uvolnit, ale nechci je ztratit. Proto jsem hledal na internetu, který jsem našel řešení založené na programu OCR a fotoaparátu smartphonu.
S fotoaparátem smartphonu Fotografoval bych dokument a poté spustil program OCR k obrazu vytvořit textový dokument tak, aby jej bylo možné použít a uložit do počítače. Ale Jaký program použít pro rozpoznávání OCR v Debianu nebo jiné distribuci Gnu / Linux?
Při procházení Internetu jsem našel několik webů, které hovořily o tomto typu programu. V Gnu / Linux je program OCR tvořen rozpoznávacím modulem a rozhraním. Pokud jde o rozpoznávací modul, existuje velmi dobrý s názvem tesseract-ocr (Osobně jsem to otestoval a funguje to velmi dobře), což je ten, který použijeme, a rozhraní, v tomto případě, vybereme gImageReader, který má velmi přátelské rozhraní pro všechny typy uživatelů.
Abychom jej nainstalovali, otevřeme terminál a napíšeme následující:
sudo aptitude install tesseract-ocr tesseract-ocr-spa gimagereader
Po dokončení instalace Musíme spustit gImageReader a je připraven k použití. Musíme jen vybrat obrázek nebo dávku obrázků, které chceme digitalizovat, a stisknout možnost nahoře s názvem „Rozpoznat vše“. Tím se spustí rozpoznávání znaků dokumentu a Přenáší jej do dokumentu txt, který můžeme otevřít v libovolném textovém editoru.
Rozhraní gImageReader je velmi intuitivní a snadno použitelné, takže použití programu OCR je velmi snadné a rychlé, což usnadňuje digitalizaci textových dokumentů.
Samozřejmě, pokud máme izolované dokumenty, musíme jít obraz po obrázku, protože pokud to uděláme jako dávku obrázků, vytvořili bychom jeden dokument txt se všemi texty dokumentů. V každém případě již neexistuje výmluva, abychom měli naše textové dokumenty v digitálním formátu Nemyslíte si?
Používat mobilní kameru ke skenování je špatný nápad, kupte si nejlevnější skener, který vám poskytne lepší výsledky než nejdražší mobilní telefon na trhu
Velmi dobře, předpokládám, že také běží na Ubuntu a derivátech. musíte to zkusit. Pozdravy.
Mnohokrát děkuji!… Tento program gImageReader je opravdu skvělý! Bylo to pro mě velmi užitečné na mém Linux-Debian-Q4OS. Potřeboval jsem to velmi naléhavě; umět digitalizovat některé obrázky z příručky o koexistenci v obytném komplexu; to bylo na papíře 20 let a muselo to být aktualizováno! Nejprve naskenujte celý dokument, stránku po stránce, pomocí skeneru tiskárny Epsom; a pak pomocí obrazových souborů jsem byl schopen upravovat a opravovat každý text velmi snadno a přímo ve stejném programu; Odtamtud generuji jednoduché dokumenty ve formátu prostého textu a díky tomu jsem je nakonec zkopíroval, vložil a provedl konečné úpravy a opravy pomocí editoru RTF Libre Office. gImageReader opravdu velmi užitečný a dobrý ... Ještě jednou moc děkuji a požehnání ... S pozdravem: DaBry.O.Díaz