Мне нужно загрузить только полные последовательности геномов из NCBI (GenBank (полный) формат). Меня интересует «полная генеама», а не «весь геном».Как загрузить полную последовательность генома в biopython entrez.esearch
мой сценарий:
from Bio import Entrez
Entrez.email = "[email protected]"
gatunek='Escherichia[ORGN]'
handle = Entrez.esearch(db='nucleotide',
term=gatunek, property='complete genome')#title='complete genome[title]')
result = Entrez.read(handle)
В качестве результатов я получаю лишь небольшие фрагменты геномов, ти размером около 484 п.н.:
LOCUS NZ_KE350773 484 bp DNA linear CON 23-AUG-2013
DEFINITION Escherichia coli E1777 genomic scaffold scaffold9_G, whole genome
shotgun sequence.
Я знаю, как сделать это вручную через веб-сайт NCBI, но это занимает очень много времени, запрос, который я использую там:
escherichia[orgn] AND complete genome[title]
и в результате я получаю несколько геномов с siz es - около 5,154,862 bp, и это то, что мне нужно сделать через ENTREZ.esearch.