Jericho HTML Parser

Tela Software:
Jericho HTML Parser
Detalhes de Software:
Versão: 3.3
Data de upload: 20 Feb 15
Revelador: Martin Jericho
Licença: Livre
Popularidade: 3

Rating: nan/5 (Total Votes: 0)

Jerich HTML Parser é uma fonte aberta, simples, mas poderosa biblioteca escrito inteiramente em Java.
Ela permite que os programadores para manipular e analisar partes de um documento HTML.
Jerich HTML Parser também incorpora funções de manipulação de formulário HTML de alto nível

O que é novo nesta versão:.

  • Correções de bugs:
  • [3581664] CharacterReference.decode () não decodifica entidades contendo dígitos - & frac12; & Frac14; & Frac34; & SUP1; & SUP2; & SUP3; & There4;
  • [3311286] SourceCompactor não respeita TEXTAREA
  • [3519131] saída Renderer incorreto quando construído com um objeto Element.
  • [3538829] saída Renderer de decoração da fonte sobre limites dos blocos incorreta.
  • Segment.getAllStartTags (nome) e Segment.getFirstElement (nome) não funcionam se o argumento contém caracteres maiúsculos.
  • O delimitador de final de uma marca de servidor comum dentro de uma tag servidor escapou é falsamente reconhecido como o delimitador final da tag escapou.
  • mudanças que poderiam afetar o COMPORTAMENTO dos programas existentes:
  • [3427073] Segment.getStyleURISegments () agora inclui conteúdo elemento de estilo, bem como valores de atributos de estilo.
  • [3427927] Segment.getURIAttributes () agora inclui os atributos de arquivo do objeto e applet elementos.
  • Comentários não mais reconhecidas dentro elementos de script durante a análise sequencial completo. Anteriormente, eles foram reconhecidos por compatibilidade com os principais navegadores, mas o comportamento do navegador moderno mudou.
  • Mudou o nível de registo de todos os erros de análise de INFO ao erro, e o nível de registro da mensagem consultivo Source.fullSequentialParse () de WARN para INFO. Os níveis anteriores deu a mensagem consultivo uma severidade maior do que os erros de análise, evitando sistemas de registro de esconder a mensagem de aviso ao mostrar erros de análise. Avisos de codificação de caracteres mantêm inalteradas em WARN nível.
  • Mudou o comportamento do método Renderer.renderHyperlinkURL (starttag) para que URLs relativos não são prestados.
  • Mudou o comportamento do representante para que o conteúdo do elemento hyperlink não é processado se for o mesmo que o URL hyperlink, ignorando qualquer http: //. Prefixo ou / sufixo
  • EndTag.tidy () agora remove espaços em branco antes do colchete de fechamento.
  • Adicionado Fonte (File) construtor.
  • método Adicionado OutputDocument.getSegment ().
  • Adicionado OutputDocument.remove (int início, fim int) método.
  • método Adicionado Renderer.setHRLineLength ().
  • Adicionado RenderToText.jsp amostra webapp.
  • método Adicionado Segment.getRowColumnVector ().
  • detecção Encoding agora ignora codificações comuns especificados na meta tags que têm um tamanho de unidade de código incompatível com a codificação preliminar.
  • atualizado para as seguintes APIs logger: slf4j-api-1.7.2, log4j-1.2.17

O que é novo na versão 3.1:

  • Correções de bugs:
  • [2793556] Infinito laço em Segment.getAllStartTags ()
  • Loop infinito em Segment.getAllElements ()
  • Segment.getFirst * métodos voltou segmentos fora do segmento delimitadora.

  • Métodos
  • Segment.getAllElements não devolver todos os elementos incluídos em algumas circunstâncias.
  • erros de documentação fixos em métodos Segment.getAllElements.
  • classe Adicionado StreamedSource.
  • mudanças que poderiam afetar o COMPORTAMENTO dos programas existentes:
  • Mudou ParseText de classe para fazer a interface.
  • Segment.getNodeIterator () agora retorna referências de caráter como nós separados.
  • marca Adicionado métodos de pesquisa com base no valor do atributo expressões regulares.
  • marca Adicionado métodos de pesquisa com base no atributo de classe HTML.
  • propriedade Source.LegacyNodeIteratorCompatabilityMode estática Adicionado temporariamente para restaurar Segment.getNodeIterator () funcionalidade ao de versões anteriores.
  • Removido de char [] métodos de pesquisa com base em ParseText.
  • Adicionado CharacterReference.appendCharTo (appendable) método.
  • Adicionado OutputDocument (Segmento) construtor.
  • programa de amostra Adicionado StreamedSourceCopy.

O que é novo na versão 3.0:

  • Correções de bugs:
  • referências de caracteres que representam caracteres suplementares unicode não foram decodificadas corretamente a pares de unidades UTF-16 código.
  • [2188446] Element.getDepth () e Element.getParentElement () retornou resultados incorretos se chamou em análise no modo de demanda.
  • Os comentários são agora reconhecidos dentro & lt; roteiro & gt; elementos.

  • MUDANÇAS
  • API que não são retrocompatíveis:
  • nome do pacote Alterado para net.htmlparser.jericho
  • Os valores dos atributos deve ser agora de Cordas em vez de CharSequence.
  • retirou todos os métodos obsoletos / classes de versões anteriores.
  • All encontrar métodos * preteridos em favor de obter * métodos a fim de aplicar uma convenção de nomenclatura consistente em todos os métodos de pesquisa tag.

  • Aulas tag
  • , Element e HTMLElements já não implementar a interface HTMLElementName. (Usar a importação estático em vez)
  • Todas as coleções agora stongly digitado usando os genéricos.
  • Mudou classe FormControlOutputStyle para enum.
  • Mudou classe FormControlType para enum.
  • Adicionado CharStreamSource.appendTo (appendable) método.
  • método Adicionado Source.iterator ().
  • Fonte agora implementa Iterable.
  • Internamente usa StringBuilder para um melhor desempenho.
  • Adicionado Source.getNextStartTag (StartTagType) método.
  • Adicionado Source.getNextEndTag (EndTagType) método.
  • Adicionado Source.getPreviousStartTag (StartTagType) método.
  • Adicionado Source.getPreviousEndTag (EndTagType) método.
  • Adicionado Segment.getAllStartTags (StartTagType) método.
  • Adicionado todos Segment.getFirst * métodos.
  • Adicionado Renderer.renderHyperlinkURL (starttag) método.
  • programa de amostra Adicionado HTMLSanitiser.
  • atualizado para slf4j-api-1.5.6

Requisitos :

  • Java 2 Standard Edition Runtime Environment

Programas semelhantes

KoMar
KoMar

11 May 15

mark3
mark3

11 May 15

XRNS-PHP
XRNS-PHP

14 Apr 15

RTextDoc
RTextDoc

17 Feb 15

Outro software de desenvolvedor Martin Jericho

Comentário para Jericho HTML Parser

Comentários não encontrado
Adicionar comentário
Ligue imagens!