Я пытаюсь добавить более 70000 новых функций в файл genbank с использованием biopython.Улучшить добавление функции genbank
У меня есть этот код:
from Bio import SeqIO
from Bio.SeqFeature import SeqFeature, FeatureLocation
fi = "myoriginal.gbk"
fo = "mynewfile.gbk"
for result in results:
start = 0
end = 0
result = result.split("\t")
start = int(result[0])
end = int(result[1])
for record in SeqIO.parse(original, "gb"):
record.features.append(SeqFeature(FeatureLocation(start, end), type = "misc_feat"))
SeqIO.write(record, fo, "gb")
Результаты просто список списков, содержащих начало и конец каждой из функций, мне нужно добавить в исходный файл GBK.
Это решение является чрезвычайно дорогостоящим для моего компьютера, и я не знаю, как улучшить производительность. Любая хорошая идея?
Что такое 'results' в ваш код? Кроме того, для того, что я вижу, очень дорого разбирать 'оригинал' каждой итерации внутри цикла for' SeqIO.parse (original, "gb") '. Под «оригиналом» вы подразумеваете переменную 'fi'? – cnluzon