UnicodeConverter é um programa Java que converte arquivos de texto e HTML no ISC, TCVN3 (ABC), VISCII, VNI, e formato VPS para Unicode UTF-8. Suporte de conversão para Unicode Composite, de caracteres numéricos Referências (NCR), e VIQR (Vietnet) também está incluído. Em todos os casos, a saída será em Unicode Normalização Formulário C, ou mais conhecido como formato Unicode precomposed.
UnicodeConverter, executável em ambos os modos Graphic User Interface (GUI) e de linha de comando, é capaz de converter vários arquivos em um diretório ou um diretório inteiro, incluindo seus subdiretórios. Com efeito, esta capacidade melhorada permite a conversão de um site inteiro para o formato Unicode UTF-8 com um único comando ou alguns cliques do mouse. Suporte a arrastar-e-soltar também está incluído.
Suporte para conversão de documentos do Word e planilhas do Excel na plataforma Windows está incluído. Esse recurso é implementado usando JACOB, uma Ponte Java-COM que permite aos clientes chamar componentes COM automação de Java. JACOB usa Java Native Interface (JNI) para fazer chamadas nativas para a COM e bibliotecas Win32; consequentemente, a funcionalidade adicionada não é portátil, nem disponível para outras plataformas. Também é fornecido suporte de conversão para arquivos Rich Text Format.
UnicodeConverter é lançado e distribuído sob a GNU General Public License. Sua homepage é a http://unicodeconvert.sourceforge.net.
REQUERIMENTOS DO SISTEMA
Você precisará ter o Java 2 Runtime Environment, Standard Edition (JRE) 1.4 ou superior instalado em sua máquina para executar UnicodeConverter. J2RE pode ser baixado gratuitamente a partir de http://java.sun.com/j2se/. O Java 2 Runtime Environment, Standard Edition (JRE) consiste na máquina virtual Java, as classes principais de plataforma Java, e arquivos de suporte para permitir que você executar aplicativos escritos na linguagem de programação Java.
No Mac OS X Tiger ou Panther, UnicodeConverter executado sem requisitos adicionais. Para Jaguar 10.2.6 ou posterior, Java 1.4.1 atualização 1 pode ser instalado.
Para ser capaz de converter documentos do Word ou do Excel, você precisa estar em um sistema Windows com o Microsoft Word ou Excel instalado. Coloque o jacob.dll arquivo em seu caminho, por exemplo, na pasta system32 ou jre / bin.
COMO FUNCIONAM UnicodeConverter
UnicodeConverter é escrito em linguagem Java e embalados como executável Java Archive. Baixe e descompacte UnicodeConverter-1.3.zip. UnicodeConverter.jar é o programa executável Java-Archive para ser executado. Você pode executá-lo clicando duas vezes no arquivo UnicodeConverter.jar ou executando a uni comando na linha de comando para iniciar o programa no modo GUI. Alternativamente, os comandos mais longas
java -jar UnicodeConverter.jar
ou (no Windows)
javaw -jar UnicodeConverter.jar
funcionará também. O nome do arquivo é sensível a maiúsculas em alguns sistemas operacionais. Certifique-se o diretório que contém o arquivo UnicodeConverter.jar é o diretório atual.
Nota: Recomenda-se que o Microsoft Word / Excel não abrir qualquer arquivo quando você converter documentos Word / Excel. Isso pode causar erros ou abrandar o processo de conversão.
Dica: Minimize o número de caixas de texto dentro de documentos do Word para alguns; ter muitos irá desacelerar significativamente a conversão.
Você pode selecionar arquivos únicos ou múltiplos, ou um diretório d para a conversão. Os arquivos de saída Unicode resultantes serão colocados em um diretório d_Unicode localizada no mesmo nível da árvore como o diretório de origem que contém os arquivos originais, que permanecem inalterados. Você também pode arrastar arquivos ou diretório a partir do gerenciador de arquivos nativo e cair sobre a janela do aplicativo para iniciar a operação de conversão.
O programa também pode funcionar como um programa de linha de comando, que é frequentemente utilizado no processamento de arquivos em lote:
java -jar UnicodeConverter.jar
onde as opções possíveis para codificação de origem são VNI, VISCII, VPS, VIQR, TCVN3, e UNI-COMP. Esta funcionalidade funciona somente para arquivos baseados em texto, não documentos Word / Excel.
Composite Unicode (UNI-COMP) arquivos de texto de origem deve ser salvos no formato UTF-8 para a correta conversão para Unicode precomposed.
As fontes padrão para os arquivos de saída UTF-8 HTML são Times New Roman, Arial e. Os usuários podem mudar para outras fontes Unicode compatível, utilizando editores HTML Unicode-compatíveis, tais como FrontPage ou Composer. Não use Unicode-incompatíveis editores (como o Bloco de notas de Win9x / Me) para editar arquivos UTF-8. Fazer isso iria corromper a seqüência de bytes UTF-8, tornando os personagens ou o arquivo ilegível.
Use Firefox, Netscape, Internet Explorer (Windows), Opera, Mozilla, Safari, OmniWeb, ou navegadores web Quimera para ver UTF-8 arquivos HTML. Você não vai precisar alterar suas configurações padrão; a tag diz aos navegadores para usar Unicode UTF-8 codificação de caracteres na exibição da página.
PREPARATIVOS DE ARQUIVO DE CONVERSÃO
Para assegurar a conversão bem sucedida de arquivos HTML em formatos de legado e para minimizar a edição de pós-conversão, alguns pré-conversão condicionado pode precisar ser realizada nos arquivos de origem. Alteração das fontes de documento original para os mais comuns no que diz respeito à sua codificação original pode ser necessária (ver tabela abaixo). A remoção de ligações obsoletas dinâmicas de fonte (.pfr ou .eot) e scripts de controle ActiveX associados (por exemplo, tdserver.js) também é recomendado, para deixá-los em desnecessariamente abrandar página de download.
Estas tarefas básicas de edição deve ser feito antes do processo de conversão real e pode ser rapidamente executada usando MDI (interface de documentos múltiplos) editores de texto que permitem abrir vários arquivos e realizando global localizar / substituir as acções em todos os arquivos abertos ao mesmo tempo. CuteHTML, TextPad, UltraEdit, EditPlus, e EditPad alguns editores de texto que o desporto tais características úteis. Eles podem ser pesquisado e descarregado a partir http://www.download.com.
Fontes Fonte codificação para documentos HTML originais
VNI VNI-Times, VNI Times, VNI-Aptima, VNI Aptima, VNI-Helve, VNI Helve
VPS VPS Times, VPS Helv
VISCII VI Times, VI Arial, HoangYen, MinhQu, PhuongThao, ThaHuong, uho
TCVN3 .VnTime, .VnTimeH, .VnArial, .VnArialH
VIQR Sem formatação de fonte
Nota: Devido à natureza de TCVN3 codificação, a conversão de algumas vogais de capital Vietnamese incorrecto resultará em caso, inferior. Alguns edição pós-conversão pode ser necessária.
FONTES compatível com Unicode
Unicode tem apenas apoio limitado no Windows 95/98 / Me, mas eles ainda são capazes de exibir todos os caracteres vietnamitas usando fontes Unicode adequadas. Suporte total a Unicode está embutido no Windows NT / 2000 / XP. Linux e Mac OS 8.5 ou superior começaram a fornecer suporte a Unicode. Mac OS X e Palm OS fornecer suporte total a Unicode.
As seguintes fontes TrueType, que vêm fornecido com Windows 98SE / Me / 2000 / XP, conter muitos caracteres Unicode, incluindo vietnamita:
Times New Roman, Courier New, Arial, Tahoma, Verdana, Palatino Linotype
Esta lista de fontes Unicode não é de forma abrangente, uma vez que existem mais e mais fontes estão sendo comercialmente desenvolvidas ou expandido para incluir caracteres Unicode.
Requisitos:
Detalhes de Software:
Comentários não encontrado