У меня есть 2 файла fastq F1.fastq и F2.fastq. F2.fastq - это файл меньшего размера, который является подмножеством чтений из F1.fastq. Я хочу читать в F1.fastq, которые НЕ находятся в F2.fastq. Следующий код python, похоже, не работает. Можете ли вы предложить изменения?получение записей, отличных от двух файлов fastq
needed_reads = []
reads_array = []
chosen_array = []
for x in Bio.SeqIO.parse("F1.fastq","fastq"):
reads_array.append(x)
for y in Bio.SeqIO.parse("F2.fastq","fastq"):
chosen_array.append(y)
for y in chosen_array:
for x in reads_array:
if str(x.seq) != str(y.seq) : needed_reads.append(x)
output_handle = open("DIFF.fastq","w")
SeqIO.write(needed_reads,output_handle,"fastq")
output_handle.close()
крест отправленный: https://www.biostars.org/p/147317/ – Pierre