Hvordan installere et OCR-program på Debian

OCR-program i Debian

I det siste har jeg digitalisert flere mengder dokumenter jeg hadde hjemme. Dokumenter som tar plass og som jeg trenger å frigjøre, men ikke vil tape. Det var derfor jeg søkte på internett en løsning basert på et OCR-program og smarttelefonkameraet.

Med smarttelefonkameraet Jeg ville fotografere dokumentet og deretter kjøre et OCR-program til bildet å lage tekstdokumentet slik at det kan brukes og lagres på datamaskinen. Men Hvilket program skal jeg bruke for OCR-anerkjennelse på Debian eller annen Gnu / Linux-distribusjon?

Jeg surfer på Internett og fant flere nettsteder som snakket om denne typen programmer. I Gnu / Linux består et OCR-program av gjenkjenningsmotoren og grensesnittet. Når det gjelder anerkjennelsesmotoren, det er en veldig god som heter tesseract-ocr (Jeg testet det personlig og det fungerer veldig bra) som er den vi skal bruke og grensesnittet, i dette tilfellet, vi velger gImageReader, som har et meget vennlig grensesnitt for alle typer brukere.

Så for å installere det åpner vi en terminal og skriver følgende:

sudo aptitude install tesseract-ocr tesseract-ocr-spa gimagereader

Når installasjonen er ferdig, Vi må kjøre gImageReader, og den er klar til bruk. Vi må bare velge bildet eller batchen av bilder som vi vil digitalisere og trykke på alternativet øverst kalt "Gjenkjenn alle". Dette starter karaktergjenkjenningen av dokumentet og Porter den til et txt-dokument som vi kan åpne med hvilken som helst tekstredigerer.

GImageReader-grensesnittet er veldig intuitivt og enkelt å bruke, så det er veldig enkelt og raskt å bruke OCR-programmet, noe som gjør oppgaven med digitalisering av tekstdokumenter veldig enkel.

Selvfølgelig, hvis vi har isolerte dokumenter, må vi gå bilde etter bilde fordi hvis vi gjør det som en gruppe bilder, vil vi lage et enkelt tekst-dokument med all teksten i dokumentene. I alle fall er det ikke lenger noen unnskyldning for å ha tekstdokumentene våre i digitalt format Tror du ikke?


Legg igjen kommentaren

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *

*

*

  1. Ansvarlig for dataene: AB Internet Networks 2008 SL
  2. Formålet med dataene: Kontroller SPAM, kommentaradministrasjon.
  3. Legitimering: Ditt samtykke
  4. Kommunikasjon av dataene: Dataene vil ikke bli kommunisert til tredjeparter bortsett fra ved juridisk forpliktelse.
  5. Datalagring: Database vert for Occentus Networks (EU)
  6. Rettigheter: Når som helst kan du begrense, gjenopprette og slette informasjonen din.

  1.   Diego Retero sa

    Å bruke mobilkameraet til å skanne er en dårlig ide, kjøp deg den billigste skanneren, og det gir deg bedre resultater enn den dyreste mobilen på markedet

  2.   Daniel sa

    Veldig bra, antar at det også kjører på Ubuntu og derivater. du må prøve det. Hilsener.

  3.   DaBry.O.Diaz sa

    Tusen takk!… Dette gImageReader -programmet er virkelig flott! Det var veldig nyttig på min Linux-Debian-Q4OS. Jeg trengte det veldig raskt; å kunne digitalisere noen bilder, fra en sameksistensmanual, i et boligkompleks; som var på papir i 20 år, og måtte oppdateres! Skann først hele dokumentet, side for side, med en Epsom -skriverskanner; og deretter med bildefilene, var jeg i stand til å redigere og korrigere hver tekst veldig enkelt og direkte i det samme programmet; Derfra genererer jeg enkle ren tekstdokumenter, og med dette til slutt kopierte, limte jeg inn og foretok sluttredigering og korreksjoner med Rich Text Editor i Libre Office. gImageReader virkelig veldig nyttig og bra ... Igjen tusen takk og velsignelser ... Med vennlig hilsen: DaBry.O.Díaz