Eu tenho aproximadamente 600 arquivos do word que eu preciso para converter para texto sem formatação, mas eu também preciso caracteres especiais da Microsoft convertidos para suas contrapartes ASCII.
Eu sei que eu posso fazer isso:
Clicando o orb > escolhendo 'Salvar como' > clicar 'Outros formatos' > escolhendo 'Texto simples' > então verificar ' Other codificação e escolhendo ASCII > verificando o 'substituição de caracteres permitem' opção, em seguida, salvá-lo - mas eu não quero fazer isso centenas de vezes...
Eu baixei o escritório aberto sem sucesso, eu emailed meus documentos do Word para o Google Docs & baixaram-los sem ajuda e as únicas opções que eu encontrei, que trabalharam, estão acima & por cortar & colar os artigos em uma página de web baseada em javascript que converte caracteres especiais de MSs para suas variantes de caracteres não-MS. Com essa opção, eu ainda tenho que abrir todos os arquivos, copiar & colá-los e, em seguida, crie um arquivo de texto & colar os resultados formatados para ele...
Eu também tentei o software PureText (remove a formatação de itens da área de transferência) e que não substitui os caracteres.
Qualquer ajuda ou uma visão seria muito apreciada.
nicomp - obrigado. Eu nunca usei uma macro antes, mas até mesmo raspar 5 segundos de cada salvamento equivaleria a uma economia de tempo significativa.
Enquanto eu não sei qualquer Linux gurus ou muito sobre como trabalhar no Linux (com excepção de uma conta de hospedagem compartilhada sem acesso root), eu estou bastante à vontade com Perl no Windows, e eu encontrei uma solução que pode funcionar:
http://www.wellho.NET/Solutions/perl-using-perl-to-Read-Microsoft-Word-Documents.html
Eu não penso sobre tentando analisar os arquivos com uma linguagem de programação & usando alguns regexs para substituir os caracteres indesejados.
Vou deixar esta aberto no caso de alguém sabe de algo que vai ser mais fácil / mais rápido, mas caso contrário - vou tentar a abordagem baseada em script de conversão como eu tenho necessidade de regular de converter arquivos do Word.
Obrigado.
A solução, para mim pelo menos, estava usando um script Perl em meu computador com Windows. Eu tentei a rota de macro e eu mantidos tendo problemas, mas com o script eu ligado a precede e com algumas modificações, coloquei todos os meus arquivos do word em um diretório, e ela salva todos eles como arquivos de texto em outro diretório, ao converter os caracteres de palavra do ms em caracteres ASCII.
Obrigado por sua sugestão - talvez não tentei isso sugerira não a opção de programação baseada em Linux.