Im пытается использовать метод global alignment
из модуля Biopython
. Использование его на коротких последовательностях легко и сразу дает матрицу выравнивания. Однако мне действительно нужно запускать его на больших последовательностях, которые у меня есть (средняя длина 2000 nucleatides (or) characters
). Однако я продолжаю сталкиваться с ошибкой Out of Memory
. Я посмотрел на SO и нашел this предыдущий вопрос. Ответы, не полезно, поскольку они ссылаются на this же сайт, который не могу получить доступ now.Apart от этого я попытался следующие шаги:Biopython Global Alignment: Out of Memory
- Я попытался с помощью
64-bit
питона, так как мой персональный компьютер имеет4gb
RAM. ssh
ed для небольшого школьного сервера с16gb
ОЗУ и попытался запустить на этом. Его все еще работает около 4 часов.
С его небольшим сценарием я не уверен, как его модифицировать. Любая помощь будет оценена.
Мой сценарий:
import os
from Bio import pairwise2
from Bio.pairwise2 import format_alignment
file_list = []
file_list = [each for each in os.listdir(os.getcwd()) if each.endswith(".dna")]
align_file = open("seq_align.aln","w")
seq_list = []
for each_file in file_list:
f_o = open(each_file,"r")
seq_list.append(f_o.read())
for a in pairwise2.align.globalmx(seq_list[0],seq_list[1]):
align_file.write(format_alignment(*a))
align_file.close()
Сколько у вас ".dna' файлов? –
Имеется 100 папок. Каждая папка имеет от 1 до 10 файлов .dna'. Я пытаюсь это только в 1 папке, которая имеет 2 файла – Beginner
Каждый файл имеет несколько строк или одну очень длинную строку? –