AREM é um baseado em MACS (análise com base Modelo de dados do chip-Seq).
Sequenciação de elevado rendimento acoplado a cromatina imuno- precipitação (ChIP-SEQ) é amplamente utilizado na caracterização a nível genoma padrões de ligação de factores de transcrição, cofactores, modificadores de cromatina, e outras proteínas de ligação de ADN. Um passo importante na análise dos dados ChIP Seq é mapear curto lê a partir de alto rendimento de sequenciação de um genoma de referência e identificação de regiões de picos enriquecidos com curto lê.
Embora tenham sido propostos vários métodos para análise ChIP-Seq, a maioria dos métodos exis- tentes considerar apenas lê que pode ser colocado de forma única no genoma de referência, e, portanto, têm baixo poder para detectar picos lo- cado dentro de sequências de repetição. Aqui nós introduzimos uma abordagem probabilística para análise de dados ChIP-Seq que utiliza todas as leituras, proporcionando um verdadeiro genoma-wide vista dos padrões de ligação.
As leituras são modeladas utilizando um modelo de mistura correspondente a K regiões enriquecido e um fundo genômica nulo. Usamos máxima probabilidade para estimar as localizações das regiões enriquecidas, e implementar uma maximização expectativa (EM) al- gorithm, chamado AREM, para actualizar as probabilidades de alinhamento de cada leitura para diferentes locais genómicos.
Para obter informações adicionais, consulte o nosso papel na RECOMB 2011 ou visite nosso website: http://cbcl.ics.uci.edu/AREM
AREM é baseado no popular pico MACS chamador, tal como descrito abaixo:
Com o aprimoramento das técnicas de sequenciamento, cromatina imunoprecipitação seguido de seqüenciamento de alta taxa de transferência (CHIP-Seq) está ficando popular para estudar as interações proteína-ADN do genoma. Para suprir a falta de poderoso método de análise ChIP-Seq, apresentamos um novo algoritmo, chamado Análise baseado no Modelo de ChIP-Seq (MACS), para a identificação de fator de transcrição locais de ligação.
MACS capta a influência da complexidade do genoma para avaliar a significância das regiões ChIP enriquecidas, MACS e melhora a resolução espacial dos locais de ligação através da combinação de ambas as informações de posição de etiqueta de sequenciação e orientação. . MACS pode ser facilmente utilizado para dados do chip-Seq sozinho, ou com amostra de controlo com o aumento da especificidade
Requisitos :
- Python
Comentários não encontrado