uni2ascii

Tela Software:
uni2ascii
Detalhes de Software:
Versão: 4.18
Data de upload: 11 May 15
Revelador: Bill Poser
Licença: Livre
Popularidade: 12

Rating: 3.5/5 (Total Votes: 2)

uni2ascii e ascii2uni converter entre UTF-8 Unicode e qualquer um de uma variedade de 7-bit ASCII equivalentes incluindo: hexadecimal e decimal HTML referências de caracteres numéricos, U-escapes, hexadecimal padrão, e hexadecimal cru.
Tais equivalentes ASCII são úteis quando incluindo texto Unicode em fonte de programa, quando inserir texto em programas da Web que podem lidar com o conjunto de caracteres Unicode, mas não são 8-bit seguro, e quando a depuração.
O Unicode escapa disponíveis são:
 
- HTML referências de caractere numérico hexadecimal (por exemplo)
- HTML referências de carácter numérico decimal (por exemplo ȳ)
- U-escapes, como usado em Python (por exemplo u00E9)
- u-escapes dentro das BMP e U-escapes para além do BMP, por exemplo, u00E9 mas U00010024.
- L -escapes (por exemplo L 00E9)
- U-escapes (por exemplo U00E9)
- U-escapes (por exemplo u00E9)
- U-escapes dentro de colchetes angulares (por exemplo)
- Escapa-x (por exemplo x00E9)
- X-escapes com chaves (por exemplo x 00E9 {})
- Hexadecimal padrão (por exemplo 0x00E9)
- Raw hexadecimal (por exemplo 00E9)
uni2ascii aceita um flag de linha de comando que determina se deve gerar superior caso AF ou minúsculas af como dígitos hexadecimais já que algumas alguns programas aceitam apenas um ou o outro. ascii2uni aceita tanto.
No caso de uni2ascii por padrão, somente caracteres fora do intervalo ASCII são convertidos. Mesmo se caracteres ASCII são também convertidos, novas linhas são preservadas, a menos que a sua conversão é explicitamente solicitado. Caracteres de espaço também são preservados, a menos que a conversão é explicitamente solicitado. No caso dos três caracteres de espaço não-ASCII (espaço Etíope palavra, espaço Ogham, e espaço ideográfica), se caracteres de espaço não são convertidos, estes são substituídos por espaço ASCII (0x20) de modo a manter a saída dentro do 7- intervalo ASCII bit.
Este pacote contém quatro programas. O programa principal é uni2ascii. Ele é escrito em C e deve ser compilado. uni2html.py é o antecessor para uni2ascii. Como está escrito em Python, não precisa ser compilado e deve rodar em praticamente qualquer computador atual. uni2ascii é superior em que de outra forma:
- Ele gera uma gama mais larga de formatos de saída.
- Fica a cerca de 20 vezes mais rápido.
- Ele lida com a entrada na gama cheia de Unicode de 32 bits. Em contraste, uni2html manipula apenas o
Basic Multilingual Plane (Avião 0) porque neste momento representa Python Unicode texto codificado internamente usando inteiros de 16 bits. Se você tem texto em, digamos, Linear B ou ugarítico, você precisa uni2ascii.
Ele faz um trabalho melhor de relatar erros. Se encontrar um erro na sua entrada, tais como mal-formados UTF-8, ele informa o local do erro, tanto em termos do número de caracteres a partir do início do processo (a partir de 0) e, em termos de contagem de bytes a partir do início do arquivo (também a partir de 0). (Contagem de caracteres e contagens de bytes não são geralmente os mesmos desde um personagem codificados em UTF-8 ocupa de um a quatro bytes.) Somente os relatórios versão Python da contagem de caracteres. uni2ascii também fornece informações sobre a natureza do erro.
O terceiro programa, ascii2uni, é o inverso da uni2ascii. Ele aceita texto contendo uma variedade de representações ASCII de caracteres Unicode e gera UTF-8 Unicode.
O quarto programa, ascii2uni.py, lê ASCII 7-bit que contém Unicode, como usado em Python e Tcl, e converte para UTF-8 Unicode escapou-u. É o programa original de que ascii2uni é uma generalização

O que é novo nesta versão:.

  • Corrigido o erro em uni2ascii em que em certos casos a contagem subsitution era demasiado elevado, que fixa Debian bug # 626268.
  • remendado para lidar com situação no NetBSD que carece de getline.
  • semântica de opção pura Esclarecido como a conversão de caracteres no intervalo ASCII diferente de espaço e de nova linha. Corrigido o erro em que isso não foi implementado corretamente para tipos UTF8.

O que é novo na versão 4.17:

  • Adicionado a uni2ascii as seguintes conversões para mais próximo ascii equivalente: U 2022 bala para 'o', U + 00B7 do meio para período, U + 0085 próxima linha para nova linha, U + 2028 separador de linha para nova linha.

O que é novo na versão 4.16:

  • O formato Q funciona novamente em ascii2uni
  • .
  • Adicionado U + 2033 DUPLO PRIME aos personagens convertidos ao seu mais próximo ascii equivalente sob usando o formato e em uni2ascii.

O que é novo na versão 4.15:

  • endian.h renomeada para u2a_endian.h para eliminar o conflito com endian.h externo.
  • cópia Removido do GNU getline de ascii2uni.c como é padrão a partir de POSIX2008.

O que é novo na versão 4.14:

  • Corrigido um erro que interferiu com a utilização do formato Q em uni2ascii.
  • Corrigido o erro em que ascification de U + 2502 e U + 2503 adicionado aspas duplas para a saída.
  • Corrigido um erro na qual -A opção S gerou um & quot; convertido tantos caracteres & quot; linha para cada personagem devido a saída em código de depuração.

O que é novo na versão 4.13:

  • Corrigido o erro que causou número excessivo de caracteres ASCII alterado para a ser relatado.

O que é novo na versão 4.12:

  • Ambos os programas permitem agora que o nome do arquivo de entrada a ser especificada em a linha de comando sem redirecionamento.

O que é novo na versão 4.11:

  • Esta versão adiciona suporte para o & lt; XX & gt; & lt; XX & gt; e formatos uXXXX%.

O que é novo na versão 4.10:

  • Esta versão corrige um bug que fez o argumento Y à flag -a de ascii2uni um não-op, e corrige as páginas do manual e ajuda para os argumentos Y e Q para a opção -a para ambos os programas.
  • O argumento Y é agora um erro para uni2ascii.
  • As informações de versão e ação resumos são mais informativos.

Programas semelhantes

JiBX
JiBX

12 May 15

Docvert
Docvert

11 May 15

GLE
GLE

15 Apr 15

Aephea
Aephea

20 Feb 15

Outro software de desenvolvedor Bill Poser

UnicodeDataBrowser
UnicodeDataBrowser

14 Jul 15

ColorExplorer
ColorExplorer

2 Jun 15

Redet
Redet

3 Jun 15

SndBite
SndBite

2 Jun 15

Comentário para uni2ascii

Comentários não encontrado
Adicionar comentário
Ligue imagens!