MetagenomeDB é uma biblioteca Python projetado para armazenar com facilidade, recuperar e anotar sequências metagenomic. & Nbsp; MetagenomeDB agir como uma camada de abstração em cima de um banco de dados MongoDB. Ele fornece uma API para criar e modificar e conectar dois tipos de objetos, ou seja, sequências e coleções:
& Nbsp; * sequências (classe Sequence) pode ser lê, contigs, clones de PCR, etc.
& Nbsp; * coleções (classe Collection) representa conjuntos de seqüências; por exemplo, lê resultante da sequenciação de uma amostra, contigs montado a partir de um conjunto de leituras, biblioteca PCR
Qualquer objeto pode ser anotada usando uma sintaxe como dicionários:
# Primeiro, nós importamos a biblioteca
importação MetagenomeDB como mdb
# Então vamos criar um novo objeto de seqüência com duas
# (Obrigatório) propriedades, 'name' e 'seqüência'
s = mdb.Sequence ({"nome": "Meu sequência", "sequência": "ATGC"})
# O objeto pode agora ser anotada
impressão s ["comprimento"]
s ["tipo"] = "ler"
# Uma vez modificado, o objeto precisa estar comprometido
# Para o banco de dados para as modificações a permanecer
s.commit ()
Objetos do tipo Sequence ou coleção podem ser ligados uns aos outros, a fim de representar os vários conjuntos de dados metagenomic. Exemplos incluem, mas não estão limitados a:
& Nbsp; * recolha de leituras resultantes de uma corrida de seqüenciamento (relação entre Sequence vários objetos e uma Collection)
& Nbsp; * conjunto de contigs resultantes da montagem de um conjunto de leituras (relação entre dois objetos da coleção)
& Nbsp; * lê que fazem parte de um contig (relação entre Sequence vários objetos e uma seqüência)
& Nbsp; * sequência que é semelhante a outra sequência (relação entre duas sequências objetos)
& Nbsp; * coleção que é parte de uma coleção maior (relação entre dois objetos da coleção)
O resultado é uma rede de sequências e recolha, que pode ser explorada utilizando métodos dedicadas; IEG, Collection.list_sequences (), Sequence.list_collections (), Sequence.list_related_sequences (). Cada um desses métodos para permitir que filtros sofisticados utilizando a sintaxe consultar MongoDB:
# Lista de todas as coleções de 'collection_of_reads' Tipo
# 'S' a sequência de pertencer a
Coleções = s.list_collections ({"type": "collection_of_reads"})
# Lista de todas as seqüências que também pertencem a essas coleções
# Com um comprimento de pelo menos 50 pb
para c em coleções:
& Nbsp; c.list_sequences impressão ({"comprimento": {"$ gt": 50}})
MetagenomeDB também fornece um conjunto de ferramentas de linha de comando para importar sequências de nucleótidos, sequências de proteínas, BLAST e alinhamento FASTA algoritmos de saída e arquivos de montagem da ECA. . Outras ferramentas são fornecidas para adicionar ou remover vários objetos, ou para anotá-los
Requisitos :
- Python
Comentários não encontrado