Como instalar um programa OCR no Debian

Programa OCR no Debian

Ultimamente tenho digitalizado várias quantidades de documentos que tinha em casa. Documentos que ocupam espaço e que preciso liberar, mas não quero perder. É por isso que pesquisando na internet eu encontrei uma solução baseada em um programa OCR e na câmera do smartphone.

Com a câmera do smartphone Gostaria de fotografar o documento e, em seguida, executar um programa de OCR para a imagem para criar o documento de texto para que possa ser usado e salvo no computador. Mas Qual programa usar para reconhecimento de OCR no Debian ou outra distribuição Gnu / Linux?

Navegando na Internet, encontrei vários sites que falavam sobre esse tipo de programa. No Gnu / Linux, um programa de OCR é composto pelo mecanismo de reconhecimento e pela interface. Quanto ao mecanismo de reconhecimento, há um muito bom chamado tesseract-ocr (Eu pessoalmente testei e funciona muito bem) qual é o que usaremos e a interface, neste caso, vamos escolher gImageReader, que possui uma interface muito amigável para todos os tipos de usuários.

Então, para instalá-lo, abrimos um terminal e escrevemos o seguinte:

sudo aptitude install tesseract-ocr tesseract-ocr-spa gimagereader

Assim que a instalação for concluída, Temos que executar o gImageReader e ele está pronto para ser usado. Basta selecionar a imagem ou lote de imagens que queremos digitalizar e clicar na opção no topo chamada "Reconhecer todas". Isso iniciará o reconhecimento de caracteres do documento e Transfira para um documento txt que possamos abrir com qualquer editor de texto.

A interface do gImageReader é muito intuitiva e fácil de usar, portanto, usar o programa OCR é muito fácil e rápido, tornando a tarefa de digitalização de documentos de texto muito fácil.

Claro, se temos documentos isolados, temos que ir imagem após imagem, porque se fizermos isso como um lote de imagens, criaremos um único documento txt com todo o texto dos documentos. Em qualquer caso, não há mais desculpa para ter nossos documentos de texto em formato digital Você não acha?


Deixe um comentário

Seu endereço de email não será publicado. Campos obrigatórios são marcados com *

*

*

  1. Responsável pelos dados: AB Internet Networks 2008 SL
  2. Finalidade dos dados: Controle de SPAM, gerenciamento de comentários.
  3. Legitimação: Seu consentimento
  4. Comunicação de dados: Os dados não serão comunicados a terceiros, exceto por obrigação legal.
  5. Armazenamento de dados: banco de dados hospedado pela Occentus Networks (UE)
  6. Direitos: A qualquer momento você pode limitar, recuperar e excluir suas informações.

  1.   Diego Retero dito

    Usar a câmera do celular para escanear é uma má ideia, compre o scanner mais barato e ele lhe dará melhores resultados do que o celular mais caro do mercado

  2.   Daniel dito

    Muito bom, suponho que também roda no Ubuntu e derivados. você tem que tentar. Saudações.

  3.   DaBry.O.Diaz dito

    Muito obrigado!… Este programa gImageReader é realmente fantástico! Foi muito útil para mim no meu Linux-Debian-Q4OS. Eu estava precisando dele com muita urgência; poder digitalizar algumas imagens, a partir de um Manual de Convivência, em um Conjunto Residencial; que ficou no papel por 20 anos e teve que ser atualizado! Primeiro, digitalize todo o documento, página por página, com um scanner de impressora Epsom; e depois com os arquivos de imagem, pude editar e corrigir cada texto de forma muito fácil e direta no mesmo programa; A partir daí eu gerei documentos de texto simples e com isso finalmente copiei, colei e fiz a edição e correções finais com o Editor de Rich Text do Libre Office. gImageReader realmente muito útil e bom ... Obrigado novamente e Bênçãos ... Atenciosamente: DaBry.O.Díaz