Detalhes de Software:
Sherlock Holmes é um motor de busca universal, um sistema de recolha e indexação de dados textuais (arquivos de texto, páginas web, etc), tanto a nível local e através da rede.
Recursos :.
- Reúne arquivos via HTTP ou de arquivos locais
- Analisa arquivos de texto, HTML, PDF e vários outros formatos usando analisadores externos (tais como MS Word e PostScript).
- Todo o sistema é modular, assim adicionando suas próprias fontes de dados ou analisadores é apenas questão de ligar módulo direita (bem, geralmente também escrevê-lo).
- Funciona bem em ambiente charset misto.
- Considera várias ocorrências do mesmo arquivo (mesmo com pequenas alterações) um único documento com vários URL.
- Tudo é altamente configurável. Você pode escrever regras de filtragem em uma linguagem especial que permite ajustar as variáveis de configuração dependendo do documento a ser processado.
- busca de palavras, frases e expressões booleanas. Pesquisando em nomes de arquivos e textos de links.
- Pesquisa Proximidade e ponderação proximidade de pesquisas regulares.
- O reconhecimento das línguas, fácil integração de lematizadores e dicionários sinonímicos.
- O verificador ortográfico baseado em freqüências de palavra observados nos dados indexados, insinuando que o usuário que sua consulta pode ser digitado incorretamente.
- resultados da pesquisa incluem contexto em cada documento.
- Escalas bem para dezenas de milhões de documentos sobre hardware de PC normal.
- User interface (front-end) é completamente separado do resto do sistema, tornando-o fácil de modificar e também para incorporar o motor de busca em aplicações existentes.
- Transferido arquivos e índices são compactados para economizar espaço.
Comentários não encontrado