catdoc

Tela Software:
catdoc
Detalhes de Software:
Versão: 0.94.2
Data de upload: 14 Apr 15
Revelador: Victor Wagner
Licença: Livre
Popularidade: 50

Rating: 4.0/5 (Total Votes: 1)

catdoc é um programa que lê um ou mais arquivos do Word da Microsoft e saídas de texto, contido insinde-los para a saída padrão. Por isso, faz mesmo trabalho para arquivos .doc, como comando cat unix para arquivos ASCII simples
projeto catdoc é agora acompanhado por xls2csv -. Programa que converte planilha Excel em arquivo de valores separados por vírgulas. Mais recente adição à suíte catdoc é catppt - programa, que extrai texto legível a partir dos arquivos do PowerPoint.
Opcionalmente, catdoc é capaz de traduzir alguns caracteres não-ASCII em seqüências de escape TeX correspoindig e converter charsets do Windows ANSI página de código ou unicode a página de código local da máquina de destino.
Também têm base de dados de sequências de substituição que são utilizados para os símbolos que não estão presentes na codificação alvo. Então, se você está tentando ler o arquivo palavra russa sob C locale, você vai ter uma transliteração.
Sob Unix ele usa nl_langinfo função para descobrir qual a codificação de saída a ser utilizado, sob DOS que usa a função DOS apropriado, que recebe o valor de página de código a partir da declaração COUNTRY em config.sys.
catdoc também é capaz de ler arquivos RTF e até mesmo texto simples, para que ele possa ser usado como de uso geral codificação conversor. (Porque é catdoc programa russo, por padrão, ele converte cp1251 para KOI8-r, quando executados no UNIX e CP866 quando executados no DOS.
Catdoc tem manipulação mesa rudimentar. No modo TeX insere e quando campo encontros de delimitação e quando encontros final de linha da tabela. Não cabeçalhos da tabela são produzidos embora.
catdoc nem sequer tentar preserver formatação de caracteres MS-Word. É objetivo é extrair texto simples e permitem que você para lê-lo e, provavelmente, reformatar com TeX, de acordo com as regras TeXnical, a maioria dos usuários do Word nem sequer ouvido falar.
xls2csv faz aproximadamente o mesmo para os arquivos do Excel. Ele extrai dados e deixa de fora qualquer formatação informações e fórmulas. Concept é que você deseja ver os dados, e não a forma como foi criado.
Há TCL / TK GUI wordview script que fornece interface gráfica para visualização de ficheiros Word e RTF usando catdoc. Desde interno representação da seqüência de Tcl é utf-8 ea maioria dos sistemas têm agora fontes Unicode, você provavelmente vai ser capaz de ler documentos em qualquer idioma usando este script.

Comentário para catdoc

Comentários não encontrado
Adicionar comentário
Ligue imagens!