question

Em massa digitalizacao e OCR - qual o software, pode ser feito?

Eu tenho um velho catalog (1960), felizmente em um 3-classificadores para que eu possa remover as páginas. Sua impressão bastante pequena, mas algumas imagens.

Gostaria de fazer a varredura em OCR-lo e fazer ele pesquisável por número de peça.

Eu tenho um scanner de 7132 fase Xerox, que tem um alimentador automático, mas não é um scanner duplex.

Então, eu estou querendo saber se é bom software onde eu possa executar através de todas as páginas ímpares, então as páginas pares, e ele pode agrupar em algo.

Formato de saída é muito importante: Eu não quero um formato TIFF de 2 TB, eu gostaria que dividi-lo em páginas, numeradas e assim por diante.

Alguma sugestão?
resposta Resposta
Se você deve ter um único arquivo - PDF ou caso contrário - você está indo para efeito com um arquivo enorme.

A menos que você converte todo o catálogo de texto que apresenta o seu próprio conjunto de desafios. Por exemplo: é o layout do documento importante?

Como Postado por outra pessoa, Adobe Acrobat pode ser usado para fazer a varredura em suas páginas de documento. Essas páginas podem então ser "capturadas" onde o texto será OCR'ed e, em seguida, salvos como metadados de renderização do PDF pesquisável. Uma vez concluída a captura de cada página (ou pequeno conjunto de páginas) você pode, em seguida, "anexar" o páginas/PDF para formar um único documento PDF. Isso vai ser o effficient método mais: cost-wise e time-wise.

Existe software para que você possa verificar exatamente como você deseja. Varredura de todas as páginas ímpares; digitalizar páginas pares; mesclar ambos os conjuntos juntos em um único documento. Informatik reformatar 9.0 (http://www.informatik.com/reformat.html) é um desses programas. Mas você ainda precisará um caminho para capturar informações sobre essas verificações para processar o documento pesquisável.

Minha recomendação depende se este é um projeto único ou uma das muitas tarefas em andamento. Para um projeto único eu iria obter o Adobe Acrobat e digitalizar e capturar algumas páginas por vez. Para vários projetos de natureza semelhante, eu poderia obter o Acrobat e Informatik reformatar.

Economia de escala. Acrobat sozinho e um monte de tempo é mais rentável para apenas um ou alguns projetos como este. Uma combinação de aplicativos de software (Acrobat, reformatar, etc.) é a opção mais econômica para muitos projetos como este.

Boa sorte.

Comentários Comentários

Guest
Lígia na 10 Fev 2023
5
Sim, é possível realizar a digitalização em massa e a conversão em OCR do seu antigo catálogo de 1960. Existem vários softwares disponíveis que podem ajudá-lo nesse processo, como o ABBYY FineReader, o Adobe Acrobat e o Tesseract. Estes softwares são capazes de digitalizar e converter o texto das imagens em documentos pesquisáveis, permitindo que você encontre informações por número de peça.

No caso do scanner Xerox 7132, apesar de não ser duplex, você ainda pode digitalizar as páginas ímpares e pares separadamente e depois agrupá-las no software de OCR. Em relação ao formato de saída, estes softwares possuem a opção de dividir o documento em páginas numeradas e salvar em formatos como PDF, facilitando o armazenamento e a pesquisa das informações.

Espero que estas sugestões sejam úteis para o seu projeto de digitalização e OCR do catálogo. Caso tenha mais dúvidas ou precise de mais informações sobre os softwares mencionados, estou à disposição para ajudar. Boa sorte!

O seu comentário
Acho que a resposta não está correta ou que você gostaria de acrescentar mais
alguma informação? Envie o seu comentário abaixo..

Guest


HTML não é permitido!

Image Code

Digite os caracteres que aparecem na imagem por isso sabemos que você é humano!

Receber um email quando alguém acrescenta outro comentário a esta pergunta



Topo da página


Home  Terms
Copyright © Accelerated Ideas 2005-2024
All rights reserved