Я пишу программу, которая читает текстовый файл и анализирует информацию внутри него. Пример текстового файла выглядит следующим образом:Назначение заголовков в текстовых файлах и массивах зданий
->DQB1*02:02:01:01
GAACTTTGCTCTTTTCACCAAAACTTAAGGCTCCTCAGGGTGTGTCTAAGACAACAGCAGTAAAAATGTCTATGACAGCAATTTTCTCTCCCCTGAAATATGATCCCCACTTAATTTGCCCTATTGAAAGAATCCCAAGTATAAGAACAACTGGTTTTTAATCAATATTACAAAGATGTTTACTGTTGAATCGCATTTTTCTTTGGCTTCTTAAAATCCCTTAGGCATTCAATCTTCAGCTCTTCCATAAT
->OMIXON_CONSENSUS_M-86-11-9517_DQB1*02:02:01
GTCCAAGCTGTGTTGACTACCACTACTTTTCCCTTCGTCTCAATTATGTCTTGGAAGAAGGCTTTGCGGATCCCTGGAGGCCTTCGGGTAGCAACTGTGACCTTGATGCTGGCGATGCTGAGCACCCCGGTGGCTGAGGGCAGAGACTCTCCCGGTAAGTGCAGGGCCACTGCTCTCCAGAGCCGCCACTCTGGGAACAGGCTCTCCTTGGGCTGGGGT
->GENDX_CONSENSUS_M-86-11-9517_DQB1*02:02:01:01
TGCCAGGTACATCAGATCCATCAGGTCCAAGCTGTGTTGACTACCACTACTTTTCCCTTCGTCTCAATTATGTCTTGGAAGAAGGCTTTGCGGATCCCTGGAGGCCTTCGGGTAGCAACTGTGACCTTGATGCTGGCGATGCTGAGCACCCCGGTGGCTGAGGGCAGAGACTCTCCCGGTAAGTGCAGGGCCACTGCTCTCCAGAGCCGCCACTCTGGGA
Я пытаюсь присвоить все строки, начинающиеся с >
как заголовок, так что я могу создать массив заголовка и остальной текст в виде массива последовательности, так после этого я могу выровнять последовательности и разбор. У меня возникают проблемы с назначением заголовков. До сих пор в моем коде у меня было следующее:
def readfile():
with open ("testAllele1.txt", "r") as myfile:
y = myfile.read()
with open(y) as z:
for line in z: # build array
counter=1
if line.startswith(">"): #header array
header(counter)=line
counter=counter+1
else:
sequence(counter)=line #sequence array
Пожалуйста, помогите! (Также я как начинающий программист, поэтому ничего сложного, пожалуйста)