Ultimamente tenho digitalizado várias quantidades de documentos que tinha em casa. Documentos que ocupam espaço e que preciso liberar, mas não quero perder. É por isso que pesquisando na internet eu encontrei uma solução baseada em um programa OCR e na câmera do smartphone.
Com a câmera do smartphone Gostaria de fotografar o documento e, em seguida, executar um programa de OCR para a imagem para criar o documento de texto para que possa ser usado e salvo no computador. Mas Qual programa usar para reconhecimento de OCR no Debian ou outra distribuição Gnu / Linux?
Navegando na Internet, encontrei vários sites que falavam sobre esse tipo de programa. No Gnu / Linux, um programa de OCR é composto pelo mecanismo de reconhecimento e pela interface. Quanto ao mecanismo de reconhecimento, há um muito bom chamado tesseract-ocr (Eu pessoalmente testei e funciona muito bem) qual é o que usaremos e a interface, neste caso, vamos escolher gImageReader, que possui uma interface muito amigável para todos os tipos de usuários.
Então, para instalá-lo, abrimos um terminal e escrevemos o seguinte:
sudo aptitude install tesseract-ocr tesseract-ocr-spa gimagereader
Assim que a instalação for concluída, Temos que executar o gImageReader e ele está pronto para ser usado. Basta selecionar a imagem ou lote de imagens que queremos digitalizar e clicar na opção no topo chamada "Reconhecer todas". Isso iniciará o reconhecimento de caracteres do documento e Transfira para um documento txt que possamos abrir com qualquer editor de texto.
A interface do gImageReader é muito intuitiva e fácil de usar, portanto, usar o programa OCR é muito fácil e rápido, tornando a tarefa de digitalização de documentos de texto muito fácil.
Claro, se temos documentos isolados, temos que ir imagem após imagem, porque se fizermos isso como um lote de imagens, criaremos um único documento txt com todo o texto dos documentos. Em qualquer caso, não há mais desculpa para ter nossos documentos de texto em formato digital Você não acha?
Usar a câmera do celular para escanear é uma má ideia, compre o scanner mais barato e ele lhe dará melhores resultados do que o celular mais caro do mercado
Muito bom, suponho que também roda no Ubuntu e derivados. você tem que tentar. Saudações.
Muito obrigado!… Este programa gImageReader é realmente fantástico! Foi muito útil para mim no meu Linux-Debian-Q4OS. Eu estava precisando dele com muita urgência; poder digitalizar algumas imagens, a partir de um Manual de Convivência, em um Conjunto Residencial; que ficou no papel por 20 anos e teve que ser atualizado! Primeiro, digitalize todo o documento, página por página, com um scanner de impressora Epsom; e depois com os arquivos de imagem, pude editar e corrigir cada texto de forma muito fácil e direta no mesmo programa; A partir daí eu gerei documentos de texto simples e com isso finalmente copiei, colei e fiz a edição e correções finais com o Editor de Rich Text do Libre Office. gImageReader realmente muito útil e bom ... Obrigado novamente e Bênçãos ... Atenciosamente: DaBry.O.Díaz