question

Como facilmente converter arquivos do Word para texto ASCII?

Eu tenho aproximadamente 600 arquivos do word que eu preciso para converter para texto sem formatação, mas eu também preciso caracteres especiais da Microsoft convertidos para suas contrapartes ASCII.

Eu sei que eu posso fazer isso:

Clicando o orb > escolhendo 'Salvar como' > clicar 'Outros formatos' > escolhendo 'Texto simples' > então verificar ' Other codificação e escolhendo ASCII > verificando o 'substituição de caracteres permitem' opção, em seguida, salvá-lo - mas eu não quero fazer isso centenas de vezes...

Eu baixei o escritório aberto sem sucesso, eu emailed meus documentos do Word para o Google Docs & baixaram-los sem ajuda e as únicas opções que eu encontrei, que trabalharam, estão acima & por cortar & colar os artigos em uma página de web baseada em javascript que converte caracteres especiais de MSs para suas variantes de caracteres não-MS. Com essa opção, eu ainda tenho que abrir todos os arquivos, copiar & colá-los e, em seguida, crie um arquivo de texto & colar os resultados formatados para ele...

Eu também tentei o software PureText (remove a formatação de itens da área de transferência) e que não substitui os caracteres.

Qualquer ajuda ou uma visão seria muito apreciada. nicomp - obrigado. Eu nunca usei uma macro antes, mas até mesmo raspar 5 segundos de cada salvamento equivaleria a uma economia de tempo significativa.

Enquanto eu não sei qualquer Linux gurus ou muito sobre como trabalhar no Linux (com excepção de uma conta de hospedagem compartilhada sem acesso root), eu estou bastante à vontade com Perl no Windows, e eu encontrei uma solução que pode funcionar:

http://www.wellho.NET/Solutions/perl-using-perl-to-Read-Microsoft-Word-Documents.html

Eu não penso sobre tentando analisar os arquivos com uma linguagem de programação & usando alguns regexs para substituir os caracteres indesejados.

Vou deixar esta aberto no caso de alguém sabe de algo que vai ser mais fácil / mais rápido, mas caso contrário - vou tentar a abordagem baseada em script de conversão como eu tenho necessidade de regular de converter arquivos do Word.

Obrigado. A solução, para mim pelo menos, estava usando um script Perl em meu computador com Windows. Eu tentei a rota de macro e eu mantidos tendo problemas, mas com o script eu ligado a precede e com algumas modificações, coloquei todos os meus arquivos do word em um diretório, e ela salva todos eles como arquivos de texto em outro diretório, ao converter os caracteres de palavra do ms em caracteres ASCII.

Obrigado por sua sugestão - talvez não tentei isso sugerira não a opção de programação baseada em Linux.
resposta Resposta
Isso é um pouco complicado, mas...

1. Criar uma macro que executa as etapas descritas acima: clique em ferramentas / macros / registro e processar um dos arquivos manualmente. Certifique-se de incluir o "Salvar/fechar" na macro para que ele não faz tudo necessário para processar o arquivo. Que irá criar uma macro que você pode executar com 2 pressionamentos de teclas.

2. Abra a pasta com os arquivos de 600 nele. Abra o Word. Arraste arquivos 5 ou 10 da pasta na palavra. Todos os arquivos serão abertos. Você pode processar cada um deles, em seguida, executando a macro.

Isto é ainda muito trabalhoso mas não anúncios ruins.

Outra alternativa seria usar sed em Linux para processar os arquivos, mas que seria necessário um conhecimento muito forte do sed e expressões regulares, que é problemático mesmo quando você tem que processar 600 arquivos. Se você conhece um Linux guru, verifique com eles. Um bom sed 'Programador' poderia precisavam até um script de uma linha que iria começar seu trabalho feito em minutos.

ComentáriosComentários
Acho que a resposta não está correta ou que você gostaria de acrescentar mais
alguma informação? Envie o seu comentário abaixo..

Guest


HTML não é permitido!

Image Code

Digite os caracteres que aparecem na imagem por isso sabemos que você é humano!

Receber um email quando alguém acrescenta outro comentário a esta pergunta


Topo da página


Home  Terms
Copyright © Accelerated Ideas 2005-2024
All rights reserved