reciprocal_smallest_distance

Tela Software:
reciprocal_smallest_distance
Detalhes de Software:
Versão: 1.1.5
Data de upload: 20 Feb 15
Licença: Livre
Popularidade: 10

Rating: nan/5 (Total Votes: 0)

reciprocal_smallest_distance é um algoritmo que usa ortologia pairwise alinhamento de sequências global e máxima verossimilhança distância evolutiva entre as sequências para detectar com precisão orthologs entre genomas.
A instalação de uma tarball de
Baixe e descompacte a versão mais recente do github:
cd ~
-L onda https://github.com/downloads/todddeluca/reciprocal_smallest_distance/reciprocal_smallest_distance-VERSION.tar.gz | XVZ tar
Instale reciprocal_smallest_distance, certificando-se de usar o Python 2.7:
cd reciprocal_smallest_distance-VERSÃO
python setup.py instalar
Usando RSD encontrar Othologs
Os comandos a seguir exemplo demonstrar as principais maneiras de executar rsd_search. Cada invocação de rsd_search requer especificar a localização de um arquivo formatado em seqüência FASTA para dois genomas, chamada de consulta e de genomas de assunto. Sua ordem é arbitrária, mas se você usar a opção --ids, os ids deve vir a partir do genoma de consulta. Você também deve especificar um arquivo para escrever os resultados das orthologs encontrados pelo algoritmo RSD. O formato do arquivo de saída contém um ortholog por linha. Cada linha contém o ID de sequência da consulta, sujeito ID de sequência, e a distância (calculada por codeml) entre as sequências. Opcionalmente, é possível especificar um arquivo contendo ids usando a opção --ids. Então rsd só vai procurar orthologs para os ids. Usando --divergence e --evalue, você tem a opção de usar limites diferentes dos padrões.
Obtenha ajuda sobre como executar rsd_search, rsd_blast, ou rsd_format:
rsd_search -h
rsd_blast -h
rsd_format -h
Encontre orthologs entre todas as seqüências nos genomas de consulta e de assunto, usando limiares de divergência padrão e eValue
exemplos rsd_search q / genomas / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genoma = exemplos / genomas / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
Encontre orthologs usando vários limiares de divergência e eValue não-padrão
exemplos rsd_search q / genomas / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genoma = exemplos / genomas / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.several.orthologs.txt
--de 0,2 1e-20 --de 0,5 0,00001 --de 0,8 0,1
Não é necessário formatar um arquivo FASTA para BLAST ou calcular BLAST bate porque rsd_search faz isso por você.
No entanto, se você planeja executar várias vezes rsd_search para os mesmos genomas, especialmente para grandes genomas, você pode economizar tempo usando rsd_format para preformatting os arquivos FASTA e rsd_blast para precomputing o BLAST hits. Ao executar rsd_blast, certifique-se de usar um --evalue tão grande quanto o maior limiar eValue você pretende dar para rsd_search.
Aqui é como formatar um par de arquivos FASTA no lugar:
rsd_format -g exemplos / genomas / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
rsd_format -g exemplos / genomas / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
E aqui é como formatar os arquivos FASTA, colocando o resultado em outro diretório (o diretório atual, neste caso)
rsd_format -g exemplos / genomas / Mycoplasma_genitalium.aa / -d Mycoplasma_genitalium.aa.
rsd_format -g exemplos / genomas / Mycobacterium_leprae.aa / -d Mycobacterium_leprae.aa.
Aqui está como calcular a frente e para trás sucessos explosão (usando o eValue padrão):
rsd_blast -v q exemplos / genomas / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genoma = exemplos / genomas / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
--forward-hits q_s.hits --reverse-hits s_q.hits
Aqui está como calcular a frente e explosão reverso bate para rsd_search, usando genomas que já foram formatadas para explosão e um eValue non-default
rsd_blast -v q Mycoplasma_genitalium.aa
--subject-genoma = Mycobacterium_leprae.aa
--forward-hits q_s.hits --reverse-hits s_q.hits
--no formato --evalue 0,1
Encontre orthologs entre todas as sequências na consulta e genomas assunto usando genomas que já foram formatadas para explosão
rsd_search q Mycoplasma_genitalium.aa
--subject-genoma = Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
--no-format
Encontre orthologs entre todas as sequências na consulta e genomas assunto usando hits que já foram computados. Observe que --no-formato está incluído, porque desde os hits da explosão já foram computados os genomas não precisa ser formatado para explosão.
rsd_search -v --query-genoma Mycoplasma_genitalium.aa
--subject-genoma = Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.default.orthologs.txt
--forward-hits q_s.hits --reverse-hits s_q.hits --no-format
Encontre orthologs para sequências específicas no genoma consulta. Para encontrar orthologs apenas para algumas sequências, usando --no-blast-cache pode acelerar a computação. YMMV.
exemplos rsd_search q / genomas / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genoma = exemplos / genomas / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o exemplos / Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
--ids exemplos / Mycoplasma_genitalium.aa.ids.txt --no-blast-cache
Formatos saída
Orthologs podem ser salvos em diversos formatos diferentes, utilizando a opção --outfmt de rsd_search. O formato padrão, --outfmt -1, refere-se a --outfmt 3. Inspirada UniProt arquivos DAT, um conjunto de orthologs começa com uma linha de parâmetros, então tem 0 ou mais linhas de ortólogos, em seguida, tem uma linha de fundo. Os parametros são o nome da consulta genoma, nome genoma assunto, limiar de divergência, e limiar eValue. Cada ortholog é em uma única linha listando a consulta id sequência, a id sequência assunto, e a estimativa de distância máxima verossimilhança. Esse formato pode representar orthologs para vários conjuntos de parâmetros em um único arquivo, bem como conjuntos de parâmetros sem orthologs. Por isso, é adequado para uso com rsd_search ao especificar vários limites de divergência e eValue.
Aqui está um exemplo que contém duas combinações de parâmetros, um dos quais não tem orthologs:
PA tLACJO tYEAS7 t0.2 t1e-15
OR tQ74IU0 tA6ZM40 t1.7016
OR tQ74K17 tA6ZKK5 t0.8215
//
PA tMYCGE tMYCHP t0.2 t1e-15
//
O formato original de RSD, --outfmt 1, é fornecida para compatibilidade com versões anteriores. Cada linha contém um ortholog, representado como id sequência assunto, consulta id sequência, e estimar a distância máxima verossimilhança. Ela só pode representar um único conjunto de ortólogos em um arquivo.
Exemplo:
A6ZM40 tQ74IU0 t1.7016
A6ZKK5 tQ74K17 t0.8215
Também fornecidos para compatibilidade é um formato utilizado internamente pelo Roundup (http://roundup.hms.harvard.edu/), que é como o formato RSD original, exceto a coluna id sequência de consulta é antes do id sequência assunto.
Exemplo:
Q74IU0 tA6ZM40 t1.7016
Q74K17 tA6ZKK5 t0.8215

Requisitos :

  • Python
  • NCBI BLAST 2.2.24
  • PAML 4.4
  • kalign 2,04

Programas semelhantes

HTSeq
HTSeq

20 Feb 15

seriesoftubes
seriesoftubes

20 Feb 15

Seal
Seal

14 Apr 15

Comentário para reciprocal_smallest_distance

Comentários não encontrado
Adicionar comentário
Ligue imagens!