Baixe grátis reciprocal_smallest_distance Para Linux ::: Bioinformática

reciprocal_smallest_distance

Tela Software:

Detalhes de Software:

Versão: 1.1.5

Data de upload: 20 Feb 15

Revelador: Todd F. DeLuca and Dennis P. Wall

Licença: Livre

Popularidade: 10

Baixar

Currently nan/5
1
2
3
4
5

Rating: nan/5 (Total Votes: 0)

reciprocal_smallest_distance é um algoritmo que usa ortologia pairwise alinhamento de sequências global e máxima verossimilhança distância evolutiva entre as sequências para detectar com precisão orthologs entre genomas.
A instalação de uma tarball de
Baixe e descompacte a versão mais recente do github:
cd ~
-L onda https://github.com/downloads/todddeluca/reciprocal_smallest_distance/reciprocal_smallest_distance-VERSION.tar.gz | XVZ tar
Instale reciprocal_smallest_distance, certificando-se de usar o Python 2.7:
cd reciprocal_smallest_distance-VERSÃO
python setup.py instalar
Usando RSD encontrar Othologs
Os comandos a seguir exemplo demonstrar as principais maneiras de executar rsd_search. Cada invocação de rsd_search requer especificar a localização de um arquivo formatado em seqüência FASTA para dois genomas, chamada de consulta e de genomas de assunto. Sua ordem é arbitrária, mas se você usar a opção --ids, os ids deve vir a partir do genoma de consulta. Você também deve especificar um arquivo para escrever os resultados das orthologs encontrados pelo algoritmo RSD. O formato do arquivo de saída contém um ortholog por linha. Cada linha contém o ID de sequência da consulta, sujeito ID de sequência, e a distância (calculada por codeml) entre as sequências. Opcionalmente, é possível especificar um arquivo contendo ids usando a opção --ids. Então rsd só vai procurar orthologs para os ids. Usando --divergence e --evalue, você tem a opção de usar limites diferentes dos padrões.
Obtenha ajuda sobre como executar rsd_search, rsd_blast, ou rsd_format:
rsd_search -h
rsd_blast -h
rsd_format -h
Encontre orthologs entre todas as seqüências nos genomas de consulta e de assunto, usando limiares de divergência padrão e eValue
exemplos rsd_search q / genomas / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genoma = exemplos / genomas / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
Encontre orthologs usando vários limiares de divergência e eValue não-padrão
exemplos rsd_search q / genomas / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genoma = exemplos / genomas / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.several.orthologs.txt
--de 0,2 1e-20 --de 0,5 0,00001 --de 0,8 0,1
Não é necessário formatar um arquivo FASTA para BLAST ou calcular BLAST bate porque rsd_search faz isso por você.
No entanto, se você planeja executar várias vezes rsd_search para os mesmos genomas, especialmente para grandes genomas, você pode economizar tempo usando rsd_format para preformatting os arquivos FASTA e rsd_blast para precomputing o BLAST hits. Ao executar rsd_blast, certifique-se de usar um --evalue tão grande quanto o maior limiar eValue você pretende dar para rsd_search.
Aqui é como formatar um par de arquivos FASTA no lugar:
rsd_format -g exemplos / genomas / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
rsd_format -g exemplos / genomas / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
E aqui é como formatar os arquivos FASTA, colocando o resultado em outro diretório (o diretório atual, neste caso)
rsd_format -g exemplos / genomas / Mycoplasma_genitalium.aa / -d Mycoplasma_genitalium.aa.
rsd_format -g exemplos / genomas / Mycobacterium_leprae.aa / -d Mycobacterium_leprae.aa.
Aqui está como calcular a frente e para trás sucessos explosão (usando o eValue padrão):
rsd_blast -v q exemplos / genomas / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genoma = exemplos / genomas / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
--forward-hits q_s.hits --reverse-hits s_q.hits
Aqui está como calcular a frente e explosão reverso bate para rsd_search, usando genomas que já foram formatadas para explosão e um eValue non-default
rsd_blast -v q Mycoplasma_genitalium.aa
--subject-genoma = Mycobacterium_leprae.aa
--forward-hits q_s.hits --reverse-hits s_q.hits
--no formato --evalue 0,1
Encontre orthologs entre todas as sequências na consulta e genomas assunto usando genomas que já foram formatadas para explosão
rsd_search q Mycoplasma_genitalium.aa
--subject-genoma = Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
--no-format
Encontre orthologs entre todas as sequências na consulta e genomas assunto usando hits que já foram computados. Observe que --no-formato está incluído, porque desde os hits da explosão já foram computados os genomas não precisa ser formatado para explosão.
rsd_search -v --query-genoma Mycoplasma_genitalium.aa
--subject-genoma = Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.default.orthologs.txt
--forward-hits q_s.hits --reverse-hits s_q.hits --no-format
Encontre orthologs para sequências específicas no genoma consulta. Para encontrar orthologs apenas para algumas sequências, usando --no-blast-cache pode acelerar a computação. YMMV.
exemplos rsd_search q / genomas / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genoma = exemplos / genomas / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o exemplos / Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
--ids exemplos / Mycoplasma_genitalium.aa.ids.txt --no-blast-cache
Formatos saída
Orthologs podem ser salvos em diversos formatos diferentes, utilizando a opção --outfmt de rsd_search. O formato padrão, --outfmt -1, refere-se a --outfmt 3. Inspirada UniProt arquivos DAT, um conjunto de orthologs começa com uma linha de parâmetros, então tem 0 ou mais linhas de ortólogos, em seguida, tem uma linha de fundo. Os parametros são o nome da consulta genoma, nome genoma assunto, limiar de divergência, e limiar eValue. Cada ortholog é em uma única linha listando a consulta id sequência, a id sequência assunto, e a estimativa de distância máxima verossimilhança. Esse formato pode representar orthologs para vários conjuntos de parâmetros em um único arquivo, bem como conjuntos de parâmetros sem orthologs. Por isso, é adequado para uso com rsd_search ao especificar vários limites de divergência e eValue.
Aqui está um exemplo que contém duas combinações de parâmetros, um dos quais não tem orthologs:
PA tLACJO tYEAS7 t0.2 t1e-15
OR tQ74IU0 tA6ZM40 t1.7016
OR tQ74K17 tA6ZKK5 t0.8215
//
PA tMYCGE tMYCHP t0.2 t1e-15
//
O formato original de RSD, --outfmt 1, é fornecida para compatibilidade com versões anteriores. Cada linha contém um ortholog, representado como id sequência assunto, consulta id sequência, e estimar a distância máxima verossimilhança. Ela só pode representar um único conjunto de ortólogos em um arquivo.
Exemplo:
A6ZM40 tQ74IU0 t1.7016
A6ZKK5 tQ74K17 t0.8215
Também fornecidos para compatibilidade é um formato utilizado internamente pelo Roundup (http://roundup.hms.harvard.edu/), que é como o formato RSD original, exceto a coluna id sequência de consulta é antes do id sequência assunto.
Exemplo:
Q74IU0 tA6ZM40 t1.7016
Q74K17 tA6ZKK5 t0.8215

Requisitos :

Python
NCBI BLAST 2.2.24
PAML 4.4
kalign 2,04

20 Feb 15 Em Software educacional e científica, Bioinformática

Comentário para reciprocal_smallest_distance

Busca por categoria

reciprocal_smallest_distance

Programas semelhantes

CLC Sequence Viewer

HTSeq

seriesoftubes

Seal

Comentário para reciprocal_smallest_distance

Comentários não encontrado

Adicionar comentário

Busca por categoria

Busca por categoria

Software Popular

HTSeq 20 Feb 15

OpenElectrophy 15 Apr 15

Staden Package 12 May 15

VULCAN 20 Feb 15

NEO 15 Apr 15

Adun 3 Jun 15

RFLP planner 3 Jun 15

reciprocal_smallest_distance

Programas semelhantes

CLC Sequence Viewer

HTSeq

seriesoftubes

Seal

Comentário para reciprocal_smallest_distance

Comentários não encontrado

Adicionar comentário

Busca por categoria

Software Popular

bein 12 May 15

Genepidgin 20 Feb 15

MetagenomeDB 12 May 15

OpenElectrophy 15 Apr 15

picme 11 May 15

CodonW 2 Jun 15

CLC Sequence Viewer 2 Jun 15