Sådan installeres et OCR-program på Debian

OCR-program i Debian

På det seneste er jeg begyndt at digitalisere forskellige mængder af dokumenter, som jeg havde hjemme. Dokumenter, der fylder, og som jeg skal frigive, men ikke vil miste. Det er derfor, at jeg fandt på internettet en løsning baseret på et OCR-program og smartphone-kameraet.

Med smartphone-kameraet ville fotografere dokumentet og derefter sende et OCR-program til billedet at oprette tekstdokumentet og kunne bruge det og gemme det på computeren. Men Hvilket program skal bruges til OCR-genkendelse på Debian eller anden Gnu/Linux-distribution?

Gennemse internettet fandt jeg flere websteder, der talte om denne type programmer. I Gnu/Linux består et OCR-program af genkendelsesmotoren og interfacet. Hvad angår genkendelsesmotoren, der er en meget god kaldet tesseract-ocr (Jeg prøvede det personligt, og det fungerer meget godt), hvilket er det, vi vil bruge, og grænsefladen, i dette tilfælde, vi vælger gImageReader, som har en ret venlig grænseflade til alle typer brugere.

Så for at installere det åbner vi en terminal og skriver følgende:

sudo aptitude install tesseract-ocr tesseract-ocr-spa gimagereader

Når installationen er færdig, vi skal køre gImageReader, og den er klar til brug. Vi skal kun vælge det billede eller batch af billeder, som vi ønsker at digitalisere og trykke på den mulighed, der er øverst kaldet "Genkend alle". Dette vil starte dokumentets tegngenkendelse og Porterer det til et txt-dokument, som vi kan åbne med enhver teksteditor.

Grænsefladen på gImageReader er meget intuitiv og nem at bruge, så brugen af ​​OCR-programmet er meget let og hurtig, hvilket gør opgaven med at scanne tekstdokumenter meget let.

Selvfølgelig, hvis vi har isolerede dokumenter, skal vi gå billede efter billede, fordi hvis vi gør det som en batch af billeder, ville vi oprette et enkelt txt-dokument med al teksten i dokumenterne. Der er i hvert fald ikke længere en undskyldning for at have vores tekstdokumenter i digitalt format Tror du ikke?


Efterlad din kommentar

Din e-mailadresse vil ikke blive offentliggjort. Obligatoriske felter er markeret med *

*

*

  1. Ansvarlig for data: AB Internet Networks 2008 SL
  2. Formålet med dataene: Control SPAM, management af kommentarer.
  3. Legitimering: Dit samtykke
  4. Kommunikation af dataene: Dataene vil ikke blive kommunikeret til tredjemand, undtagen ved juridisk forpligtelse.
  5. Datalagring: Database hostet af Occentus Networks (EU)
  6. Rettigheder: Du kan til enhver tid begrænse, gendanne og slette dine oplysninger.

  1.   Diego Retero sagde han

    At bruge mobilkameraet til at scanne er en dårlig idé, køb den billigste scanner, og det vil give dig bedre resultater end den dyreste mobil på markedet

  2.   Daniel sagde han

    Meget godt, det kører vel også på Ubuntu og derivater. du skal prøve det. Vær hilset.

  3.   DaBry.O.Diaz sagde han

    Mange tak!... Dette gImageReader-program er virkelig fantastisk! Det var meget nyttigt for mig i mit Linux-Debian-Q4OS. Jeg havde brug for det meget presserende; at kunne digitalisere nogle billeder, fra en Coexistence Manual, i et boligkompleks; den stod på papiret i 20 år, og den skulle opdateres! Først Scan hele dokumentet, side for side, med en Epsom Printer Scanner; og så med billedfilerne var jeg i stand til at redigere og rette hver tekst meget nemt og direkte i det samme program; Derfra genererer jeg simple almindelige tekstdokumenter, og med dette kopierede, indsatte jeg og lavede endelig redigering og rettelser med Libre Office Rich Text Editor. gImageReader er virkelig meget nyttig og god... Endnu engang mange tak og velsignelser... Med venlig hilsen: DaBry.O.Díaz