Open Search Server (OSS) é um software motor de busca desenvolvido sob a GPL v3 licença de código aberto.
Construído com os melhores tecnologias de código aberto disponíveis, Open Search Server é uma peça estável, de alta performance de software. É tanto um motor de busca moderno e um conjunto de algoritmos de busca de alta potência texto completo.
Open Search Server é executado no Windows 20xx / XP / Vista, Mac OS X, Solaris e Linux + Java Virtual Machine.
OSS Motor
Este add-on é uma biblioteca nativa desenvolvido em C ++, e um impulso considerável para as capacidades do Open Search Server. Graças a um código nativo otimizado, OSS Motor recebe performances excepcionais de Open Search Server. As melhorias incluem:
* Pertinência personalização oferece possibilidades gigantescas
* Indexação de documentos é mais rápido por uma ordem de magnitude
* Melhor tempos de resposta
* Número Heightened de possíveis consultas simultâneas
OSS motor funciona como um add-on para Open Search Server no Linux, Solaris, Windows 20xx / XP / Vista e Mac OS X se em 32 ou 64 bits. Ele é distribuído através da atribuição de uma licença proprietária
Recursos :.
- Multi-línguas de indexação. Os documentos podem ser indexados em dezesseis línguas -. Chinês, Dinamarquês, Holandês, Inglês, finlandês, francês, alemão, húngaro, italiano, norueguês, Português, Romeno, Russo, Espanhol, Sueco, Turco
- analisadores Multi-lingual fatia sentenças em palavras, em seguida, executar algoritmos lemmatisation de palavras com base no idioma do documento (singular / plural, sexo, verbos conjugados, etc).
- As esteiras rolantes vá através de web sites e sistemas de arquivos para construir rapidamente e facilmente seu índice.
- Numerosos formatos de documentos são suportadas, tais como XML, HTML / XHTML, Adobe PDF, Microsoft Word, PowerPoint, OpenOffice, etc.
- A interface web é construído em torno do poder oferecido pelo quadro Zkoss. Corre-se com os principais navegadores Ajax. Esta interface do tipo RIA é mais confortável para utilizar como a de um cliente pesado.
- Fácil configuração através de um único arquivo XML, que inclui campos de definição e as opções de indexação.
- integração graças rápidas para uma interface XML por meio de consultas HTTP (XML sobre HTTP).
O que é novo nesta versão:.
- Esta versão desenvolvedor revela novos recursos poderosos e algumas correções de bugs
- O recurso de captura de tela captura automaticamente as imagens das páginas da Web que está sendo rastreado.
- As consultas de pesquisa são capazes de retornar termos de campos não armazenado.
- filtros negativos estão disponíveis.
- O rastreador da Web é capaz de seguir os arquivos mapa do site.
O que é novo na versão 1.2.1-r987:
- Novos recursos:
- 3176150: tempo selo / data li>
- 3186042: não Desativar sendo permitida (robots.txt)
- 3182953: Crawl URL a partir de um banco de dados
- 3182950: Teste padrão e lista de exclusão deactivable
- 3182097: Adicionando campo impulso apoio
- 3175585: Mais como este recurso
- 3169421: apoio japonês e coreano
- 3159477: Identificar páginas da web idênticos
- 3151757: Upgrade para PDFBox 1.4.x
- 3141193: suporte FTP / FTPS no rastreador arquivo
- 3141192: suporte SMB / CIFS no rastreador arquivo
- 3034238: Crawler capaz de fazer logon no site protegido
- 3011773: Adicionar Quartz como planejador de serviço
- 3138603: Atualize Tomcat para a versão 6.0.xx
- 3103055: Converter entidades HTML
- 3087916: Upgrade para PDFBox 1.2
- 3043692: Torrent Analisador
- 3042488: analisador de áudio
- 2882260: Adicionar um analisador para text / plain
- 3010010: analisador RTF
- 3038733: Adicionar um filtro de cascalho
- 3036262: Log gestão
- 3031800: interface de esquema
- 3031204: Adicionar suporte Ngram
- 3008440: réplica do Índice
- 3026212: API e interface para eliminação de documentos
- 3023327: extração de domínio na Web Crawler Sub
- 2820289: rastreador banco de dados
- 3019035: Neglight url dinâmico enquanto rastejando
- 3017277: Permitir curinga consulta no navegador da URL
- 3016491: Url Exportador
- 3016566: Monitoramento API
- 3015939: Conjunto colapso
- 2830490: tamanho do índice
- 3011847: Score explicação
- 3008633: Possibilidade de desligar o destaque
- 2997836: Nos campos retornados que têm campos extras de meta tags
- 2997826: Possibilidade de índice apenas o conteúdo especificado
- 2991252: Possibilidade de arquivo binário do índice e para adicioná-lo a um documento
- 2982545: Extraindo informações de frequência termo
- 2881385: API para recuperar o indice disponível
- 2887376: Enhancement para os índices de página de índice caindo
- 2881388: API para listar / criar / modificar campos em um esquema especificado
- 2973374: Upgrade para ZKoss 5.0.x
- 2970747: atualizar para a versão 6.0.26 Tomcat
- 2966139: Statistics perdidos quando OSS restart
- 2964704: Atualização para Lucene 2.9.x
- 2958015: Adicionar arquivo fonte
- 2958005: Atualizar biblioteca Apache HttpClient para 4.0.1
- 2956498: Fornecer uma forma de enviar relatório de estatísticas por e-mail
- 2953803: Upgrade para PDFBox 1.0
- 2953802: Upgrade para POI 3.6
- 2953575: detecção Charset deve olhar meta http-equiv
- 2953524: Especifique charset padrão para analisador
- 2929332: pós Faceting colapso
- 2900462: Atualize POI a 3,5 para xlsx e docs apoio
- 2900449: Atualize PDFBox a 0,8
- Correções de bugs:
- 3178432: valores errados cron no programador
- 3104065: acidentes de lagartas arquivo com java.io.EOFException
- 3090248: Statistics configuração perdido quando a adição de campos
- 3051308: não é interpretado
- 2881689: Requests.xml falha para rodar em algumas plataformas Windows
- 3019491: NullPointerException & gt; em java.util.regex.Matcher
- 3017481: O rastreador web seleciona o anfitrião em ordem alfabética
- 3015838: problema rastreador da Web com a codificação UTF-8 BOM
- 2993103: NoClassDefFoundError BouncyCastleProvider
- 2990960: palavra-chave não são destacadas em trechos
- 2982541: sinónimos Frase gerar palavras indesejadas
- 2934214: Shifted destacando no trecho
O que é novo na versão 1.2 Beta:.
- foram adicionados mais de 50 novos recursos e correções de bugs
- Um índice pode ser replicado em um servidor remoto.
- Um filtro de n-gramas e um filtro de cascalho fornecer novas possibilidades, como uma caixa de sugestões, a tolerância ortografia errada, e geração automatizada tópico.
- Um rastreador banco de dados de suporte juntar consultas e arquivos externos foi adicionado.
- Várias melhorias foram feitas para o rastreador da Web, como um exportador de URL, a extração de sub-domínio, uma lista de exclusão, rastreamento manual e um filtro de parâmetro.
- Uma API e interface de Web para acompanhamento e supervisão.
- O novo analisador de áudio oferece a capacidade de índice de torrent, MP3 / MP4, OGG Vorbis, FLAC e WMA.
Foi adicionada
O que é novo na versão 1.1.2:
- Novos recursos:
- Adicionar arquivo fonte
- Lucene somente leitura apoio
- Correções de bugs:
- API PHP falhar em alguma consulta com caracteres XML errado
- Problema com estatísticas agregação
- Classificar Funcionalidades de parecem ignorar a ordem de classificação
- Problema de desempenho com cache grande campo
- Problema com o desempenho do rastreador web
- O valor negativo em estatísticas web crawler
- problema Comportamento da função de curinga
- duplicação de campo retornado no XML retornado
O que é novo na versão 1.1:
- Suporte sinônimos
- Suporte Spellcheck
- rastreador da Web e rastreador arquivo
- Suporte a idiomas adicionais: romeno, turco, dinamarquês, russo e caracteres chineses individuais
- Suporte Formato OpenDocument
- Gerenciamento de vários índices em uma única instância
Comentários não encontrado