NCBI C ++ Toolkit oferece, de domínio público, bibliotecas portáteis gratuitas sem restrições de uso. Ele funciona em Unix, MS Windows e plataformas Mac OS:
ย ท Networking e comunicação entre processos (IPC) biblioteca com adaptadores iostream
ย ท Biblioteca multithreading
ย ท CGI e Fast-CGI Biblioteca
ย ท HTML Generation Biblioteca
ย ท banco de dados SQL Biblioteca Acesso
ย ท C ++ biblioteca wrapper para BerkeleyDB
ย ท C ++ iostream Adaptor / Wrapper Biblioteca
ย ท GZIP e BZ2 C ++ Wrapper Biblioteca com adaptadores iostream
ย ท ASN.1 e XML serialização Biblioteca com C ++ Código Generator Tool (Datatool)
ย ท Data e Hora Biblioteca
ย ท Arquivo Biblioteca Função Sistema
ย ท argumento de linha de comando, Configuração e Biblioteca de processamento de Meio Ambiente
ย ท Sequence Alignment Algoritmos Biblioteca
ย ท Biblioteca BLAST Motor
ย ท Biológica Sequências Retrieval e Biblioteca de processamento
ย ท bibliotecas FLTK portátil e GUI baseado em OpenGL e gráficos
Além do acima exposto, há um lote inteiro bibliotecas mais úteis, tanto para fins gerais e relacionadas à biotecnologia que estão constantemente desenvolvido, mantido e utilizado na produção da vida real por centenas de Web e aplicativos autônomos e seus programadores (também contado em centenas).
Se você é um desenvolvedor C ++ você vai encontrar a natureza portátil das bibliotecas muito úteis na construção de aplicações multi-plataforma, mesmo se você não tem muito interesse em Bioinformática. Bibliotecas, como aqueles para a CGI / Fast-CGI, HTML, Networking, Acesso banco de dados SQL, ASN.1 e serialização XML são de uso bastante geral e pode ser usado em uma variedade de aplicações fora do domínio do problema Bioinformática.
O C ++ Toolkit sofre desenvolvimento ativo com as bibliotecas sendo construídas a cada noite. O código fonte está disponível gratuitamente através de FTP e CVS. A documentação para o Toolkit C ++ está disponível on-line no formato NCBI Bookshelf e também o livro como download no formato do Acrobat PDF
O que é novo nesta versão:.
< p>- DESTAQUES:
- Adicionado LDS2 (Local v.2 Armazenamento de Dados), que é baseado em SQLite3, tem novas funcionalidades e um melhor desempenho. Também implementou LDS2 carregador de dados para usar LDS2 do Gerenciador de objetos.
- XmlWrapp -este conveniente API manipulação XML tem sido principalmente acabado (e até mesmo polido).
- Implementado tunneling e autorização de conexões HTTP e tunneling de soquetes seguros, através de proxies HTTP.
- CFormatGuess agora permite distinguir entre GTF, GFF3 e GFF2. É uma mudança, possivelmente quebrando. Para mais detalhes veja abaixo.
- principais partes implementadas de CFeatTree, a classe para organizar recursos definidos em uma seqüência biológica em uma hierarquia que reflete suas relações pai-filho (com base nos subtipos de recurso).
- corelib:
- conversão independente da localidade Implementado de corda para o dobro e costas; bibliotecas centrais alterados para usá-lo.
- NSTR :: Justificar () - para a formatação de parágrafos de texto .
- CNcbiApplication - fazer FindProgramExecutablePath estático, e mais robusto; adicionar um método GetAppName de alto nível estático. Procure por arquivos de configuração globais em mais casos.
- CMetaRegistry :: FindRegistry -. Novo método de expor a lógica determinar qual arquivo (se houver) para carregar
- CEnvironmentCleaner -. Nova classe para descartar as variáveis de ambiente indesejado
- CFileIO - de volta ao comportamento original:. Não fechar o identificador de arquivo se ele é atribuído através SetFileHandle ()
- SÉRIE:
- A serialização de objetos de dados AnyContent - fixo para reconhecer e corretamente as características do processo em seus valores .
- Corrigida a leitura de dados XML para atribuir um valor padrão elemento quando ele não tem conteúdo.
- Adicionado suporte para seqüências de elementos, em que o elemento tem um valor padrão.
- DataTool:
- geração de código corrigido de:
- objetos de dados escolha;
- tipos binários de dados com atributos.
- conversão corrigida dos valores tipo double para preservar dígitos mais significativos.
- CONNECT:
- opção de soquete keepalive Adicionado (fSOCK_KeepAlive).
- teste de conectividade Adicionado NCBI (CConnTest).
- UTILITES:
- g_FindDataFile -. Nova função para localizar arquivos de dados em (configuráveis) locais padrão
- CChecksumStreamWriter -. Nova classe para calcular soma de verificação dos dados gravados em um córrego
- g_GZip_ScanForChunks () - nova API, para consultar posições fluxo compactado. Adicionado implementação para obter posições para gzip-arquivos separados dentro arquivo gzip concatenadas.
- manipuladores de transmissão Adicionado compressão / descompressão (include / util / compressa / stream_util.hpp).
- CFormatGuess (util / format_guess. {H / c} pp) actualizado, com uma mudança possivelmente quebrando. A finalidade disto é permitir que CFormatGuess para distinguir entre GTF, GFF3, e GFF2. Atualmente trata da mesma forma todos esses formatos em um valor 'eGtf'. O valor antigo 'eGtf »(3) está sendo substituído por' eGtf_POISONED ', e não será devolvido novamente. O novo valor para 'eGtf' (21) vai significar um arquivo que deve ser lido com CGtfReader (objtools / leitores / gtf_reader.hpp). O novo valor 'eGff3' (22) é para arquivos feito para ser lido com CGff3Reader (objtools / leitores / gff3_reader.hpp), e 'eGff2 »(24) é para arquivos feito para ser lido com CGff2Reader (include / objtools / leitores /gff2_reader.hpp)
- BIO-objetos:
- CBioseq :: GetNonLocalId - Novo método para ajudar sequências lugar importados de arquivos FASTA com especificações alcance em mais de contexto; envolto por CBioseq_Handle :: GetNonLocalIdOrNull (também novo).
- CSeq_id :: IdentifyAccession - Implementar ou melhorar o reconhecimento de mais prefixos (GA, HH, HI, HO-HU, JA-Jo, EAAA-EZZZ, e IAA-IZZ, alguns dos quais correspondem à nova possibilidade de DDBJ TPA dados WGS) e em mistos TPA adesões de proteínas (principalmente a partir de EMBL, mas alguns de GenBank também).
- Distinguir WGS adesões mestre por um novo bit bandeira. Relaxe lógica reconhecimento PDB over-estrito.
- CSeq_id :: IsValidLocalID, CSeq_id :: ParseIDs -. A nova funcionalidade para trabalhar com identificadores de seqüência de texto simples, consignado fora do CFastaReader e generalizada um pouco
- SSeqIdRange - Novo Tipo (completo com analisador e on-the-fly & quot; iterator & quot;) para trabalhar com faixas de Seq-ID, como presente em alguns modificadores de origem FASTA defline .
- BIO-TOOLS:
- CFastaOstream - Opcionalmente aceitar títulos customizados para sequências individuais. Tag gamas de cadeia negativa com os principais "c do.
- CFastaReader - Apoiar gamas de cadeia negativa e sintaxe gap compacto de estilo defline da Lantejoula (? & Quot; & gt; N & quot; onde N é um número; ou & quot; & gt; unk100 & quot;)
- COBALT:
- Adicionado de linha de comando opção -num_domain_hits que limita número de domínios conservados por sequência utilizada no cálculo restrições de alinhamento.
- As árvores filogenéticas:
- Adicionado mais elevado nível de interface para calcular árvore filogenética de alinhamentos de seqüência (por exemplo BLAST e resultados cobalto). Classe CPhyTreeCalc calcula árvore filogenética, e CPhyTreeFormater imprime a árvore em formato Newick e Nexus.
- Bio-Objeto:
- CheckNumRows implementada () e outros métodos para alinhamentos esparsas.
- Para reduzir a pegada de memória: acrescentou-ganchos ler para reduzir a memória usada por alinhamentos após deserialization; Na-fio agora usa um byte de memória, sempre que possível; Escolha Score.value agora está incorporado no CScore.
- Capitalizar adesão em CSeq_id :: GetLabel ().
- BIO-OBJETO:
- Adicionado métodos de acesso para campos boolean em CTableFieldHandle.
- Adicionado GetBestGeneForFeat () com base em CFeatTree.
- Implementado GetBestOverlappingFeat () em CFeatTree.
- Adicionado rápido cscope :: GetTaxid ().
- carregamento a granel Implementado para acc / ver, gi, rótulo e taxid.
- lacunas de comprimento zero Adicionado verificar para CSeqMap e CSeqVector.
- Implementado GetLength () e GetCoverage () para locais de obrigações.
- Melhorias:
- método auxiliar Adicionado para preencher CFeatTree no local.
- acelerou mapeamento de locais CSeq_loc_mix simples em CFeat_CI.
- mais rigorosa triagem dos recursos no CFeat_CI para evitar ambiguidades.
- getters CSeq_feat_Handle agora trabalham com Seq-tabela apresenta também.
- características Seq-mesa agora suportam campos de usuário multi-nível.
- Não Seq-repto seq-mesas são agora reconhecidos, mesmo que localizado em pedaço de divisão.
- acelerou CBioseq_Handle :: AddId ().
- Otimizado cscope :: AttachXxx ().
- divisão Suporte de anotação nomeado.
- CSeqVector e CanGetRange de CSeqVector_CI () agora retornar falso ao invés de lançar uma exceção.
- Permitir para especificar como lidar com alças existentes em ResetHistory ().
- Otimizado re-parentalidade se mais recursos são adicionados para CFeatTree.
- Adicionado possibilidade de depurar cscope criação / exclusão.
- Muitas alterações na funcionalidade de limpeza do C ++ para imitar a funcionalidade de limpeza que já existe em C. Ainda há mais trabalho a ser feito com BasicCleanup, mas o progresso significativo foi feito. Pouco tem sido feito para ExtendedCleanup ainda.
- CSeq_loc_Mapper agora pode ser inicializado com um GC-Assembly.
- Correções de bugs:
- mapeamento fixo de locais mix de cadeia menos em CFeat_CI.
- Muitas correções na forma CFeatTree vincula recursos.
- Várias correções thread-segurança.
- Corrigido erro de digitação prevenção acrescentando alinha e gráficos para CSeq_annot_EditHandle.
- salvaguarda contra exceções ao ordenar recursos em CFeat_CI.
- GENBANK carregador de dados:
- anotações externos Registered HPRD.
- Adicionado param exclude_wgs_master opcional em leitores pubseqos / pubseqos2.
- carregamento a granel Implementado para acc / ver, gi, rótulo e taxid.
- Adicionado CGBDataLoader :: CloseCache ().
- Melhoria:
- solicitações de carregamento Use a granel em cscope :: GetBioseqHandles ().
- estatísticas leitor separadas por tipo de blobs carregados.
- Adicionado timestamp para mensagens de depuração do GenBank.
- Use IConnValidator para abrir conexões PubSeqOS.
- Adicionado split-versão aos pedidos do pedaço e subchaves do pedaço no GenBank cache para evitar o uso de pedaços erradas quando o estado de divisão blob é alterado no ID.
- nomes param Adicionado secundárias menos confuso para tempo de espera aberta.
- Não multiplicar repetir contagem por número de conexões.
- Test Manager OBJECT e demo APLICAÇÕES:
- id2_fetch_simple - acrescentou. Opções -id para arbitrárias seq-id
- test_bulkinfo -. Novo aplicativo de teste
- FASTA:
- funcionalidade de tabela recurso C ++ tornou-se mais funcional, como por parte do projeto BankIt.
- asn2flat utilitário
- O grande número de mudanças para flatfile formatador para trazê-lo muito mais próximo estado a libertar-ready (possivelmente liberar pronto neste momento, embora algumas questões relativamente menores permanecem).
- XMLWRAPP:
- falha de segmentação fixo em caso de tomar uma referência à expressão XPath resultados em execução.
- Adicionado ajudantes para obter ID pública, identificação do sistema e nome DTD para subconjuntos externos e internos.
- Adicionado métodos para pesquisa de atributos do nó.
- execução fixo de expressão XPath:. Agora começa a partir do nó dado
- Fixo procura atributos (incluindo padrão) quando um namespace é fornecido.
- Adicionado a capacidade de executar expressão XPath, sem necessidade de registar namespaces explicitamente.
- Adicionado a capacidade de fornecer os recipientes para a recolha de erros e avisos durante a análise de documentos.
- Adicionado a capacidade de modificar os valores e namespaces de atributos padrão do nó.
- Adicionado a capacidade de testar se um atributo é o padrão.
- Adicionado a capacidade de inserir ou remover atributos, tendo em conta os seus namespaces.
- Adicionado a capacidade de retirar declaração XML quando um documento é salvo.
- WindowMasker:
- Adicionado um novo formato de entrada, & quot; & quot ;; seqids com este formato de entrada, a entrada é um arquivo que contém um ID de seqüência em cada linha, e o algoritmo usa o Gerenciador de Bio-Object para procurar as sequências.
- Adicionado uma nova classe CWinMaskConfig, para armazenar todos os parâmetros de configuração WindowMasker. A classe pode ser usado para adicionar os argumentos de linha de comando necessários para CArgDescriptions, e em seguida, obter os parâmetros de configuração dos argumentos de linha de comando.
- BUILD QUADRO (UNIX):
- Interpretar especificações de linha de comando de APP_PROJ ou LIB_PROJ como uma sugestão para limpar outros * Configurações _PROJ não forneceram também lá. (Requer GNU Make;. Constrói com sol fazem continuar a trabalhar como antes)
- Fornecimento mais alvos em subdiretórios:. * _F (Usando makefiles locais planos produzidos sob demanda, ignorando dependências em outras partes da árvore), * _fd (acondicionamento de nível superior Makefile.flat), clean_sources e purge_sources
- Configurar e seus scripts de conveniência (compiladores / unix / sh *.):
- Notável nova bandeira --sem-3psw -. Para não usar com qualquer software de 3rd-party
- Adicionado um cheque de GLEW.
- controlos melhorados para Boost e OpenGL.
- Suporte especificar caminhos executado em Darwin (Mac) sistemas com toolchains modernos.
- BLAST:
- Em Darwin (Mac OS X), construir apenas para processadores Intel mesmo em constrói outra forma universal devido a uma limitação PowerPC toolchain.
- Adicionado suporte para recuperar NCBI Taxonomy IDs para os quais o apoio WindowMasker está disponível.
- permitir a especificação de uma seqüência de consulta junto com múltiplos arquivos de alinhamento de sequências em psiblast.
- Adicionado suporte de banco de dados para mascarar o disco.
- banco de dados Adicionado soft-mascaramento para pesquisas traduzidos.
- Adicionado suporte para btop (operações BLAST de rastreamento) e consulta e comprimento assunto no relatório tabular.
- aplicativos de linha de comando - permitir psiblast para procurar várias consultas, acrescentou -input_type opcional para makeblastdb
- Permitir o uso de melhor hit e XML no modo blast2sequences.
- Melhor desempenho formatação para pesquisas remotas.
- makembindex podem agora construir índice megablast mascarado diretamente de um banco de dados BLAST nucleotídeo usando as informações mascarando armazenado no banco de dados BLAST. Isto é conseguido através -db_mask nova opção de linha de comando para makembindex. A opção aceita o ID de número inteiro do algoritmo de filtragem suportado pela base de dados BLAST. A opção só pode ser aplicada em conjunto com -iformat blastdb.
- Para auxiliar um usuário em descobrir os ids numéricos de algoritmos de filtragem suportados por uma base de dados BLAST, os -show_filters bandeira é introduzido. Aplicando a bandeira com blastdb -iformat e banco de dados BLAST como uma entrada provocar makembindex a saída uma lista de algoritmos de filtragem disponíveis e sair.
- APLICAÇÕES NetCache:
- NetCache é reformulado para incluir os seguintes recursos:
- melhor gestão de espaço em disco;
- trabalho-lock menos com blobs, controle de versão é usada em vez;
- escuta multi-porta e configurações por cliente diferenciador.
- NetCache e ICACHE APIs:
- Use Uint8 em todos os lugares para o tamanho do blob.
- Permitir recuperação blob parcial.
- Introduzida proteção de senha blob; senhas vazias são tratados como nenhuma senha.
- Trabalhadores APIs nó:
- Novo parâmetro para encerrar o nó trabalhador se o seu consumo de memória exceder o limite especificado (parâmetro & quot; total_memory_limit & quot;) .
- Novo parâmetro para encerrar o nó trabalhador se o seu tempo de execução ultrapasse o limite especificado (parâmetro & quot; total_time_limit & quot;) .
- aplicações de rede:
- netscheduled
- Corrigido um bug que causou falta de resposta ao comando fila de exclusão.
- remote_app
- Novo parâmetro de configuração (& quot; tmp_dir & quot;). Para controlar como temporário nome do diretório é gerado - para reduzir seu comprimento
- Log blob escrita erro.
- netcache_control
- Permitir recuperação blob parcial.
- New -remove comando para excluir blobs por seus ids.
- Novo parâmetro -auth para especificar cadeia de autenticação para usar.
- Novos comandos -reconf e -reinit para uso pelos administradores NetCache.
- netschedule_control
- modo de compatibilidade Habilitado para tornar o trabalho netschedule_control com nós trabalhadores mais velhos.
- cgi2rcgi.cgi
- Não crie um blob NetCache vazio como um espaço reservado para a mensagem de progresso.
- erros Log grade que são relatados para o usuário.
- Permitir espaços no parâmetro ID de trabalho.
- Suporte a saída das informações status do trabalho em formato JSON.
- Permitir templates HTML personalizado a ser definido por erros da rede e outros eventos.
- Adicionado não-cache cabeçalhos HTTP para evitar o cache de resultados intermediários.
- ncfetch.cgi
- Novo parâmetro para acessar blobs protegidos por senha.
- Interpretar parâmetro extra & quot; filename & quot; como um nome de arquivo para o arquivo baixado.
.
BIBLIOTECAS
MANAGER
O que é novo na versão 31 de dezembro de 2008:
- Esta versão adiciona um método para calcular específicos de coluna pseudocounts em PSI-BLAST.
- É refatora a biblioteca de serviços de rede.
- Acrescenta framework de teste de unidade e registro de erros para todas as classes da API do arquivo.
- Ela corrige suporte pthread em IRIX. Ela reforça apoio de serialização XML.
- Ela corrige suporte para Sybase.
- Ele adiciona suporte para tabelas de pesquisa menores para pequenos procedimentos.
- Ele adiciona uma API para recuperar estatísticas carregadora GenBank.
- Tem diversos outros aprimoramentos, speedups e correções de bugs.
Comentários não encontrado