Я хотел бы переименовать некоторые файлы генома FASTA, используя некоторую информацию первой строки, но я не могу понять это.Переименуйте файлы FASTA с частью их первой строки
Вот пример, два файла:
GCA_000007365.1_ASM736v1_genomic.fna
:
>AE013218.1 Buchnera aphidicola str. Sg (Schizaphis graminum), complete genome
ATGTCAAAGTCGTATTTAAAAAATTTTGATGTTATTGTTATTGGTGGAGGGCATGCTGGCACTGAAGCTGCAGCAGCCTC
TGCAAGAGTAGGTTGTAAAACATTATTATTAACTCAAAAAATAACTGATATAGGTGTATTATCTTGCAATCCTGCTATCG
GCA_000012065.2_ASM1206v2_genomic.fna
:
>CP000048.1 Borrelia hermsii DAH, complete genome
TACCACTACACTTATTAATAATACATACTCACGCCTGGGGGGAAAAATTCAATAATGGAAACCTTACAAATATAAAACCA
CTACAAATAGGTATTATTCAGCATAATTATATAAATTTAACTCCTTATAATCAACATTATAAATATTACGCTTTCATTGG
Я хотел бы переименовать тысячу *.fna
файлов с информацией о первой линии в файле FASTA, давая:
Buchnera_aphidicola_AE013218.1.fna
Borrelia_hermsii_CP000048.1.fna
Заголовок FASTA остается без изменений. Просто имя файла.
Что _exactly_ переходит в имя файла? Первые три слова в порядке 2, 3, 1 без '>', связанных с подчеркиваниями? Что-то другое? –
Точно @BenjaminW. слова 2, 3, 1 разделены «_» (2_3_1) без «>» и ничего больше. – Tetraodienne