Detalhes de Software:
Versão: 1.0.3
Data de upload: 13 Apr 15
Licença: Livre
Popularidade: 77
Concebido como um invólucro em torno lxml, agora expande lxml com todas as características normalmente necessários em mineração de dados HTML
Características :.
- Características gerais:
- Nice jQuery-como seletores CSS
- Acesso simples aos atributos do elemento
- maneira fácil para converter HTML para outro formato (BBcode, Markdown, etc)
- Poucas funções muito boas para o trabalho com o texto
- Salva todas as características originais da lxml
- Funções para trabalhar com texto puro:
- to_unicode - Converter string a seqüência de caracteres Unicode
- strip_accents - acentos faixa de uma seqüência
- strip_symbols - Strip feio símbolos Unicode de uma string
- strip_spaces - Tira os espaços em excesso de uma string
- strip_linebreaks - Tira o excesso de quebras de linha a partir de uma seqüência
Requisitos :
- lxml
Comentários não encontrado