Paano mag-install ng isang programa ng OCR sa Debian

Programa ng OCR sa Debian

Kamakailan-lamang ay na-digitize ko ang maraming mga dokumento na mayroon ako sa bahay. Mga dokumento na tumatagal ng puwang at kailangan kong magbakante ngunit ayaw kong mawala. Iyon ang dahilan kung bakit ang paghahanap sa internet na aking natagpuan isang solusyon batay sa isang programa ng OCR at ang camera ng smartphone.

Gamit ang smartphone camera Kukuhanan ng litrato ang dokumento at pagkatapos ay magpatakbo ng isang programa ng OCR sa imahe upang likhain ang tekstong dokumento upang maaari itong magamit at mai-save sa computer. Pero Anong programa ang gagamitin para sa pagkilala sa OCR sa Debian o iba pang pamamahagi ng Gnu / Linux?

Sa pagba-browse sa Internet, nakakita ako ng maraming mga website na nag-usap tungkol sa ganitong uri ng programa. Sa Gnu / Linux, isang programang OCR ay binubuo ng engine ng pagkilala at ang interface. Tulad ng para sa pagkilala engine, mayroong isang napakahusay na tinatawag na tesseract-ocr (Personal kong sinubukan ito at gumagana ito ng napakahusay) na kung saan ay ang gagamitin namin at ang interface, sa kasong ito, pipiliin namin ang gImageReader, na kung saan ay may isang napaka-friendly interface para sa lahat ng mga uri ng mga gumagamit.

Kaya, upang mai-install ito magbubukas kami ng isang terminal at isulat ang sumusunod:

sudo aptitude install tesseract-ocr tesseract-ocr-spa gimagereader

Kapag natapos na ang pag-install, Kailangan naming patakbuhin ang gImageReader at handa na itong gamitin. Kailangan lang naming piliin ang imahe o pangkat ng mga imahe na nais naming i-digitize at pindutin ang pagpipilian sa tuktok na tinatawag na "Kilalanin Lahat." Sisimulan nito ang pagkilala ng character ng dokumento at Hinahatid ito sa isang dokumento ng txt na maaari nating buksan sa anumang text editor.

Ang interface ng gImageReader ay napaka-intuitive at madaling gamitin, kaya ang paggamit ng programa ng OCR ay napakadali at mabilis, ginagawang napakadali ang gawain ng pag-digitize ng mga dokumento ng teksto.

Siyempre, kung mayroon kaming nakahiwalay na mga dokumento, kailangan naming pumunta sa imahe pagkatapos ng imahe dahil kung gagawin namin ito bilang isang pangkat ng mga imahe, gagawa kami ng isang solong txt na dokumento kasama ang lahat ng teksto ng mga dokumento. Sa anumang kaso, wala nang dahilan upang magkaroon ang aming mga dokumento sa teksto sa digital na format Hindi ba sa tingin mo?


Iwanan ang iyong puna

Ang iyong email address ay hindi nai-publish. Mga kinakailangang patlang ay minarkahan ng *

*

*

  1. Responsable para sa data: AB Internet Networks 2008 SL
  2. Layunin ng data: Kontrolin ang SPAM, pamamahala ng komento.
  3. Legitimation: Ang iyong pahintulot
  4. Komunikasyon ng data: Ang data ay hindi maiparating sa mga third party maliban sa ligal na obligasyon.
  5. Imbakan ng data: Ang database na naka-host ng Occentus Networks (EU)
  6. Mga Karapatan: Sa anumang oras maaari mong limitahan, mabawi at tanggalin ang iyong impormasyon.

  1.   Diego Retero dijo

    Ang paggamit ng mobile camera upang mag-scan ay isang masamang ideya, bumili ng pinakamurang scanner at bibigyan ka nito ng mas mahusay na mga resulta kaysa sa pinakamahal na mobile sa merkado.

  2.   Daniel dijo

    Napakahusay, ipagpalagay ko na tumatakbo din ito sa Ubuntu at mga derivatives. kailangan mong subukan ito. Pagbati po.

  3.   DaBry.O.Diaz dijo

    Maraming salamat!… Ang gImageReader Program na ito ay talagang Mahusay! Napaka kapaki-pakinabang para sa akin sa aking Linux-Debian-Q4OS kailangan ko ito ng napilit; upang mai-digitize ang ilang mga imahe, mula sa isang Manu-manong Coexistence, sa isang Residential Complex; iyon ay nasa papel sa loob ng 20 taon, at kailangang i-update! Unang I-scan ang buong dokumento, pahina sa pamamagitan ng pahina, na may isang Epsom Printer Scanner; at pagkatapos ay kasama ang mga file ng imahe, nagawa kong i-edit at maitama ang bawat teksto nang napakadali at direkta sa parehong programa; Mula doon ay nakakalikha ako ng mga simpleng payak na dokumento ng teksto, at kasama nito sa wakas ay nakopya ko, na-paste at ginawang pangwakas na pag-edit at pagwawasto sa Rich Text Editor ng Libre Office. gImageReader talagang napaka kapaki-pakinabang at mahusay ... Muli maraming salamat at Mga Pagpapala ... Taos-puso: DaBry.O.Díaz