Detalhes de Software:
Versão: 3.3
Data de upload: 20 Feb 15
Licença: Livre
Popularidade: 56
Jerich HTML Parser é uma fonte aberta, simples, mas poderosa biblioteca escrito inteiramente em Java.
Ela permite que os programadores para manipular e analisar partes de um documento HTML.
Jerich HTML Parser também incorpora funções de manipulação de formulário HTML de alto nível
O que é novo nesta versão:.
- Correções de bugs:
- [3581664] CharacterReference.decode () não decodifica entidades contendo dígitos - & frac12; & Frac14; & Frac34; & SUP1; & SUP2; & SUP3; & There4;
- [3311286] SourceCompactor não respeita TEXTAREA
- [3519131] saída Renderer incorreto quando construído com um objeto Element.
- [3538829] saída Renderer de decoração da fonte sobre limites dos blocos incorreta.
- Segment.getAllStartTags (nome) e Segment.getFirstElement (nome) não funcionam se o argumento contém caracteres maiúsculos.
- O delimitador de final de uma marca de servidor comum dentro de uma tag servidor escapou é falsamente reconhecido como o delimitador final da tag escapou.
- mudanças que poderiam afetar o COMPORTAMENTO dos programas existentes:
- [3427073] Segment.getStyleURISegments () agora inclui conteúdo elemento de estilo, bem como valores de atributos de estilo.
- [3427927] Segment.getURIAttributes () agora inclui os atributos de arquivo do objeto e applet elementos.
- Comentários não mais reconhecidas dentro elementos de script durante a análise sequencial completo. Anteriormente, eles foram reconhecidos por compatibilidade com os principais navegadores, mas o comportamento do navegador moderno mudou.
- Mudou o nível de registo de todos os erros de análise de INFO ao erro, e o nível de registro da mensagem consultivo Source.fullSequentialParse () de WARN para INFO. Os níveis anteriores deu a mensagem consultivo uma severidade maior do que os erros de análise, evitando sistemas de registro de esconder a mensagem de aviso ao mostrar erros de análise. Avisos de codificação de caracteres mantêm inalteradas em WARN nível.
- Mudou o comportamento do método Renderer.renderHyperlinkURL (starttag) para que URLs relativos não são prestados.
- Mudou o comportamento do representante para que o conteúdo do elemento hyperlink não é processado se for o mesmo que o URL hyperlink, ignorando qualquer http: //. Prefixo ou / sufixo
- EndTag.tidy () agora remove espaços em branco antes do colchete de fechamento.
- Adicionado Fonte (File) construtor.
- método Adicionado OutputDocument.getSegment ().
- Adicionado OutputDocument.remove (int início, fim int) método.
- método Adicionado Renderer.setHRLineLength ().
- Adicionado RenderToText.jsp amostra webapp.
- método Adicionado Segment.getRowColumnVector ().
- detecção Encoding agora ignora codificações comuns especificados na meta tags que têm um tamanho de unidade de código incompatível com a codificação preliminar.
- atualizado para as seguintes APIs logger: slf4j-api-1.7.2, log4j-1.2.17
O que é novo na versão 3.1:
- Correções de bugs:
- [2793556] Infinito laço em Segment.getAllStartTags ()
- Loop infinito em Segment.getAllElements ()
- Segment.getFirst * métodos voltou segmentos fora do segmento delimitadora.
- Segment.getAllElements não devolver todos os elementos incluídos em algumas circunstâncias.
- erros de documentação fixos em métodos Segment.getAllElements.
- classe Adicionado StreamedSource.
- mudanças que poderiam afetar o COMPORTAMENTO dos programas existentes:
- Mudou ParseText de classe para fazer a interface.
- Segment.getNodeIterator () agora retorna referências de caráter como nós separados.
- marca Adicionado métodos de pesquisa com base no valor do atributo expressões regulares.
- marca Adicionado métodos de pesquisa com base no atributo de classe HTML.
- propriedade Source.LegacyNodeIteratorCompatabilityMode estática Adicionado temporariamente para restaurar Segment.getNodeIterator () funcionalidade ao de versões anteriores.
- Removido de char [] métodos de pesquisa com base em ParseText.
- Adicionado CharacterReference.appendCharTo (appendable) método.
- Adicionado OutputDocument (Segmento) construtor.
- programa de amostra Adicionado StreamedSourceCopy.
Métodos
O que é novo na versão 3.0:
- Correções de bugs:
- referências de caracteres que representam caracteres suplementares unicode não foram decodificadas corretamente a pares de unidades UTF-16 código.
- [2188446] Element.getDepth () e Element.getParentElement () retornou resultados incorretos se chamou em análise no modo de demanda.
- Os comentários são agora reconhecidos dentro & lt; roteiro & gt; elementos.
- API que não são retrocompatíveis:
- nome do pacote Alterado para net.htmlparser.jericho
- Os valores dos atributos deve ser agora de Cordas em vez de CharSequence.
- retirou todos os métodos obsoletos / classes de versões anteriores.
- All encontrar métodos * preteridos em favor de obter * métodos a fim de aplicar uma convenção de nomenclatura consistente em todos os métodos de pesquisa tag.
- , Element e HTMLElements já não implementar a interface HTMLElementName. (Usar a importação estático em vez)
- Todas as coleções agora stongly digitado usando os genéricos.
- Mudou classe FormControlOutputStyle para enum.
- Mudou classe FormControlType para enum.
- Adicionado CharStreamSource.appendTo (appendable) método.
- método Adicionado Source.iterator ().
- Fonte agora implementa Iterable.
- Internamente usa StringBuilder para um melhor desempenho.
- Adicionado Source.getNextStartTag (StartTagType) método.
- Adicionado Source.getNextEndTag (EndTagType) método.
- Adicionado Source.getPreviousStartTag (StartTagType) método.
- Adicionado Source.getPreviousEndTag (EndTagType) método.
- Adicionado Segment.getAllStartTags (StartTagType) método.
- Adicionado todos Segment.getFirst * métodos.
- Adicionado Renderer.renderHyperlinkURL (starttag) método.
- programa de amostra Adicionado HTMLSanitiser.
- atualizado para slf4j-api-1.5.6
MUDANÇAS
Aulas tag
Requisitos :
- Java 2 Standard Edition Runtime Environment
Comentários não encontrado