WordTabulator destina-se a análise de texto. Com a ajuda de wordTabulator você pode gerar índice de elementos nominativos extraídos do conjunto texto definido. Elementos do Word podem ser palavras, N-grams (de tamanho definido) ou frases (syntagmes). O programa pode processar textos como em ordinárias 2 bytes que codificam (ANSI), como em vários bytes de codificação UTF-8. Textos originais são definidos como um conjunto de arquivos de texto simples ou HTML XML documentos / / SGML. No último caso, o programa pode filtrar o conteúdo de marcação. Além disso, você pode processar apenas conteúdo definido dentro de tags emparelhados selecionados. Ou você pode ignorar que o conteúdo do processamento. Inclui módulo de morfologia para russos, três formatos diferentes de índice de produção, três tipos diferentes de elementos nominativos (palavras, N-gramas e frases), navegador de contexto, e verdadeira ordenação alfabética.
Detalhes de Software:
Versão: 3.5
Data de upload: 15 Apr 15
Licença: Livre
Popularidade: 370
Tamanho: 2708 Kb
Comentários não encontrado