2015-09-03 1 views
2

Я использовал treecluster Bio.Cluster, который приводит к объекту Tree. Я собираю матрицу экспрессии генов. Я хочу простой способ пройти это дерево и добавить дополнительные функции (дополнительная информация, такая как значения p или имена терминов для каждого узла, который я хочу), если это необходимо. Я обнаружил, что хорошим пакетом для такого рода работ является ete2, но для этого требуется дерево как строка Newick.Можно ли преобразовать объект Tree в Biopython в формат Newick?

Есть функция, которая может преобразовать объект Tree в Newick или вы знаете лучший способ, чем ete2?

Спасибо заранее, Л.

ответ

0

Bio.Cluster.Tree в Newick формате, например:

входного файла cyano.txtgithub

 
gene 0 15min 1hour 6hours 15hours 
sll0617 0.0 -0.141164092921 -0.564656371686 -0.219393769051 -0.582969948517 
slr0452 0.0 -0.124988599702 -0.499954398807 0.195680498436 0.0781478593432 
slr1513 0.0 0.788547158236 0.228594792282 0.255819396258 0.304823683415 
sll1471 0.0 -0.770355431265 -1.10115338201 -1.00607440632 -0.834932250086 
sll1694 0.0 -0.328239937586 -2.16037133914 -1.184544471 -1.36760041273 
sll0430 0.0 2.57611845993 0.920296714116 0.331897478085 0.353984672049 
sll0851 0.0 -0.260488607867 -1.04195443147 -0.870951657169 -0.563146663432 
sll1260 0.0 0.488375211397 1.03336768086 1.05808458732 1.10257501897 
sll1031 0.0 2.22636090218 1.2737708006 1.22441048661 1.13556192142 
..... 

использование treecluster in python (view example source)

from Bio import Cluster 
handle = open("cyano.txt") 
record = Cluster.read(handle) 
handle.close() 
genetree = record.treecluster(method='s') 
genetree.scale() 
exptree = record.treecluster(dist='u', transpose=1) 
record.save("cyano_result", genetree, exptree) 

Это создаст файлы cyano_result.cdt, cyano_result.gtr и cyano_result.atr

теперь мы можем использовать R и Bioconductor конвертировать ртд в Newick

Установите последнюю версию R, затем получите последнюю версию Bioconductor, запустив R и введите команды

#optional, for install bioconductor and ctc library 
source("http://bioconductor.org/biocLite.R") 
biocLite() 
biocLite("ctc") 

#code to convert atr to newick 
library("ctc") 
h <- xcluster2r("cyano_result.atr") 
write(hc2Newick(h),file='cyano_result.newick') 

в cyano_result, мы получаем:

 
(1:0.356996468574314, 
    (2:0.0826361905178331, 
    (5:0.0469498559561281, 
    (3:0.513417484951725,4:0.513417484951725) 
    :0.0469498559561281) 
    :0.0826361905178331) 
:0.356996468574314); 

получения следующий участок

tree view

 Смежные вопросы

  • Нет связанных вопросов^_^