arem este un bazat pe MACS (bazat pe analiza Model de date CHIP Seq).
Secventiere-tranziteaza mare cuplat cu precipitații imuno cromatinei (Chip-Seq) este utilizat pe scară largă în caracterizarea genomului la nivel modele de legare de factori de transcriptie, cofactori, modificatori cromatinei, si alte proteine de legare de ADN. Un pas important în analiza datelor CHIP Seq este de a mapa scurt citește de la secvențierea high-throughput pentru un genom de referință și identifica regiunile de vârf îmbogățite cu scurt citește.
Deși au fost propuse mai multe metode pentru analiza CHIP Seq, majoritatea metodelor isting foste consideră doar spune care pot fi plasate în mod unic în genomul de referință, și, prin urmare, au redus de energie pentru detectarea vârfuri ampla- sat în secvențe repetate. Aici vom introduce o abordare probabilistică pentru analiza datelor, CHIP Seq care utilizează toate citeste, oferind o vedere cu adevărat genomului-larga de modele de legare.
Citește sunt modelate cu ajutorul unui model amestec corespunde K regiuni îmbogățit și un fond genomica nul. Noi folosim probabilitatea maximă pentru a estima locațiile din regiunile îmbogățite, și să pună în aplicare o așteptare-maximizare (EM) al-gorithm, numit arem, pentru a actualiza probabilitatea de aliniere de fiecare citi în diferite locații genomice.
Pentru informații suplimentare, a se vedea lucrarea noastră în RECOMB 2011 sau vizitați site-ul nostru: http://cbcl.ics.uci.edu/AREM
Arem se bazează pe populara apelantului MACS vârf, așa cum este descris mai jos:
Odată cu îmbunătățirea tehnicilor de secvențiere, cromatinei immunoprecipitation urmată de secvențiere high-throughput (Chip-Seq) devine popular pentru a studia interactiunile de proteine-ADN-genomului. Pentru a rezolva problema lipsei de puternic metoda analizei-CHIP Seq, vom prezenta un algoritm roman, numit Analiza model bazat pe chip-Seq (MACS), pentru identificarea site-uri cu caracter obligatoriu factor de transcriere.
MACS surprinde influența complexității genomului pentru a evalua importanța regiunilor ChIP îmbogățite, și MACS îmbunătățește rezoluția spațială a siturilor de legare prin combinarea informațiilor atât poziția tag secventiere si orientare. . MACS poate fi ușor utilizat pentru date-Chip Seq singur, sau cu proba de control cu creșterea specificității
Cerințe :
- Python
Comentariile nu a fost găsit