reciprocal_smallest_distance

Screenshot Software:
reciprocal_smallest_distance
Detalii soft:
Versiune: 1.1.5
Incarca data: 20 Feb 15
Licenţă: Gratuit
Popularitate: 10

Rating: nan/5 (Total Votes: 0)

reciprocal_smallest_distance este un algoritm orthology perechilor care utilizează aliniere secvență global și probabilitatea maximă distanță evolutiv între secvențele de detectează cu precizie ortologi între gene.
Instalarea de la un fișier
Descărcați și untar cea mai recentă versiune de la github:
cd ~
-L curl https://github.com/downloads/todddeluca/reciprocal_smallest_distance/reciprocal_smallest_distance-VERSION.tar.gz | Gudron xvz
Instalați reciprocal_smallest_distance, asigurându-vă că pentru a utiliza Python 2.7:
cd reciprocal_smallest_distance-VERSION
python setup.py instalare
Utilizarea dinari pentru a găsi Othologs
Următoarele comenzi exemplu demonstrează principalele modalități de a rula rsd_search. Fiecare invocare de rsd_search impune specificarea locația unui fișier secvență formatat-FASTA pentru două gene, numit interogarea și genomul subiect. Pentru lor este arbitrară, dar dacă utilizați opțiunea --ids, ID-urile de trebuie să vină din genomul de interogare. Trebuie să specificați un fișier pentru a scrie rezultatele ortologi constatate de algoritmul RSD. Formatul fișierului de ieșire conține un ortolog pe linie. Fiecare linie conține secvența id de interogare, sub rezerva id secvență, și distanța (calculate prin codeml) între secvențele. Puteți specifica, opțional, un fișier care conține ID-uri folosind opțiunea --ids. Atunci RSD va căuta doar pentru ortologi pentru aceste id-uri. Utilizarea --divergence și --evalue, aveți opțiunea de a utiliza praguri diferite de cele implicite.
Obțineți ajutor cu privire la modul de a rula rsd_search, rsd_blast, sau rsd_format:
rsd_search -h
rsd_blast -h
rsd_format -h
Cauta ortologi între toate secvențele din interogare și subiect gene, folosind praguri de divergență implicit și evalue
Exemple rsd_search -q / gene / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genomului = exemple / gene / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
Găsiți ortologi utilizarea mai multor praguri de bază non-default divergență și evalue
Exemple rsd_search -q / gene / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genomului = exemple / gene / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.several.orthologs.txt
--de 0,2 1e-20 --de 0.5 0.00001 --de 0,8 0,1
Nu este necesar să formatați un fișier FASTA pentru BLAST sau calcula BLAST spectaculos deoarece rsd_search o face pentru tine.
Totuși, dacă aveți de gând pe care rulează de mai multe ori rsd_search pentru aceleași gene, în special pentru gene mari, puteți economisi timp prin utilizarea rsd_format pentru preformatting fișierele FASTA și rsd_blast la precomputing BLAST spectaculos. Când se execută rsd_blast, asigurați-vă că pentru a utiliza un --evalue fel de mare ca cea mai mare prag evalue intenționați să dea rsd_search.
Iată cum să formatați o pereche de fișiere FASTA în loc:
rsd_format -g exemple / gene / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
rsd_format -g exemple / gene / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
Și aici este cum să formatați fișierele FASTA, punând rezultatele într-un alt director (directorul curent în acest caz)
rsd_format -g exemple / gene / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa -d.
rsd_format -g exemple / gene / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa -d.
Iată cum de a calcula înainte și puncte de sablare (folosind implicit evalue) invers:
rsd_blast -v -q exemple / gene / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genomului = exemple / gene / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
--forward-hit-uri q_s.hits --reverse-hit-uri s_q.hits
Iată cum de a calcula înainte și explozie inversă spectaculos pentru rsd_search, folosind gene care au fost deja formatate pentru explozie și un evalue non-default
rsd_blast -v -q Mycoplasma_genitalium.aa
--subject-genomului = Mycobacterium_leprae.aa
--forward-hit-uri q_s.hits --reverse-hit-uri s_q.hits
--no-format --evalue 0,1
Cauta ortologi între toate secvențele din interogare și genomul fac folosind gene care au fost deja formatate pentru explozie
rsd_search -q Mycoplasma_genitalium.aa
--subject-genomului = Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
--no-format
Cauta ortologi între toate secvențele din interogare și genomul fac folosind puncte care au fost deja calculate. Observați că --no-format este inclus, deoarece deoarece loviturile de sablare au fost deja calculate gene nu trebuie să fie formatate pentru explozie.
rsd_search -v --query genomului Mycoplasma_genitalium.aa
--subject-genomului = Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.default.orthologs.txt
--forward-hit-uri q_s.hits --reverse-hit-uri s_q.hits --no-format
Găsiți ortologi pentru secvente specifice in genomul interogare. Pentru găsirea ortologi pentru doar câteva secvențe, folosind --no-explozie-cache-ului poate accelera de calcul. YMMV.
Exemple rsd_search -q / gene / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genomului = exemple / gene / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
Exemple -o / Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
--ids exemple / Mycoplasma_genitalium.aa.ids.txt --no-explozie-cache
Formate de ieșire
Ortologi pot fi salvate în mai multe formate diferite, folosind opțiunea --outfmt de rsd_search. Formatul implicit, --outfmt -1, se referă la --outfmt 3. Inspirat de Uniprot DAT fișiere, un set de ortologi începe cu o linie parametri, atunci are 0 sau mai multe linii ortolog, apoi are o linie capăt. De parametes sunt numele de interogare genomului, numele genomului subiect, pragul de divergență, și pragul evalue. Fiecare ortolog este pe o singură linie listă de secvență id-ul de interogare, id-ul de secvență subiect, iar estimarea maximă distanță risc. Acest format poate reprezenta ortologi pentru mai multe seturi de parametri într-un singur fișier, precum și seturi de parametri fără ortologi. Prin urmare, este potrivit pentru utilizarea cu rsd_search când specificarea mai multe praguri de divergență și evalue.
Aici este un exemplu care conține 2 combinații de parametri, dintre care unul nu a avut nici ortologi:
PA tLACJO tYEAS7 t0.2 t1e-15
SAU tQ74IU0 tA6ZM40 t1.7016
SAU tQ74K17 tA6ZKK5 t0.8215
//
PA tMYCGE tMYCHP t0.2 t1e-15
//
Formatul original al RSD, --outfmt 1, este prevăzută pentru compatibilitate. Fiecare linie conține un ortolog, reprezentate ca id secvență subiect, de interogare secvență id, iar estimarea maximă distanță risc. Se poate reprezenta doar un singur set de ortologi într-un fișier.
Exemplu:
A6ZM40 tQ74IU0 t1.7016
A6ZKK5 tQ74K17 t0.8215
De asemenea, prevăzut pentru compatibilitate înapoi este un format folosit intern de Roundup (http://roundup.hms.harvard.edu/), care este ca formatul RSD inițial, cu excepția coloana id secvență de interogare este înainte id-ul de secvență subiect.
Exemplu:
Q74IU0 tA6ZM40 t1.7016
Q74K17 tA6ZKK5 t0.8215

Cerințe :

  • Python
  • NCBI BLAST 2.2.24
  • PAML 4.4
  • Kalign 2,04

Software similare

snakemake
snakemake

20 Feb 15

Seal
Seal

14 Apr 15

CaPSID
CaPSID

20 Feb 15

STEPS
STEPS

15 Apr 15

Comentarii la reciprocal_smallest_distance

Comentariile nu a fost găsit
Adauga comentarii
Porniţi pe imagini!