Пример файла одног здесь:Файл SAM для FASTA с awk или sed?
@SQ SN:gi|669687444|gb|KJ769480.1| LN:1200
@SQ SN:gi|669687442|gb|KJ769479.1| LN:900
@SQ SN:gi|669687440|gb|KJ769478.1| LN:1162
@SQ SN:gi|669687438|gb|KJ769477.1| LN:1074
@SQ SN:gi|669687436|gb|KJ769476.1| LN:1194
@SQ SN:gi|669687434|gb|KJ769475.1| LN:1074
@SQ SN:gi|669687432|gb|KJ769474.1| LN:1194
@SQ SN:gi|669687430|gb|KJ769473.1| LN:1074
@SQ SN:gi|669687428|gb|KJ769472.1| LN:1194
@SQ SN:gi|669687426|gb|KJ769471.1| LN:1189
@SQ SN:gi|669687424|gb|KJ769470.1| LN:1074
@SQ SN:gi|669687422|gb|KJ769469.1| LN:370
@PG ID:bwa PN:bwa VN:0.7.10-r789 CL:bwa mem /ibers/ernie/home/thh32/Scratch/Hidden_virome/Against_NCBI_viral/Sweetspot/bwa_NCBI_viral_nucl test.fa
Rank10_clean_2213:4:1101:3636:2018 4 * 0 0 * * 0 0 AAACCATTCGCTTCCTTTAAATCTATCTGTTATTTCCCTTAAATAATTTGAACCATGCGAAGCAATATAAGGATTTAAGACGAAACAATTCTTTTCTCT * AS:i:0 XS:i:0
Rank10_clean_2213:4:1101:3508:2062 4 * 0 0 * * 0 0 TCGCTATGCTTACTCCAATGTGGCGTACCAGTGTGCGAAGCTGATGCGCAAACCACGGGAAAAGGAGAAACTCTATCGGTGGATCGTGGATATGGAATTCAAATCCGGTGAGATCCC * AS:i:0 XS:i:0
Rank10_clean_2213:4:1101:1470:2237 4 * 0 0 * * 0 0 GCGGAGCATATCCCCTTGCGTCCTGGACGGCGTGCCCGCATTCATGGGCGGCCACGGCCGCAGCTGCGATGGAATTCATCCCATACACGCTTTCTGAAAGGTTTACGGTCTTGCTCCTGGGATCG * AS:i:0 XS:i:0
Rank10_clean_2213:4:1101:1540:2114 4 * 0 0 * * 0 0 GCGCGCAAGGTCCCGCGGATACTGGTCTGCCATATCTCCAACCCGCCCCTTAAGCGTGATGACGAAATGATCTACCCGAAAAGCTCAGCCGGGTTCCATCCCGGCAACGACGCGCCGCG * AS:i:0 XS:i:0
Wanted выход:
>Rank10_clean_2213:4:1101:7988:2027
GCCATCTCCAACCTCACCACCGGTAGCGGCAACCAGATGAGCTACAACCTCATCGCCATCCTTTGCGGCTTGATCGCCATGGCCGTCACCGCAATCTGCGCTCACTACGGCAAAAAGACCGTCAGCTTAATCCCATTCGTCCTTGGCATGTGCGCCGGTTATGTCGCGGCC
>Rank10_clean_2213:4:1101:6459:2053
TCACCACTTATTGCATCACCATACACATCAGTTACTGTGATTGTTACTGTGATGTTACCATCGATAGAGGGGTTATAATCTGAACATTCAATGTTTGGTATACTTGTGCTTAACAAAGTAACATCAGATTTCAATGTGTCAATTCTGCTATCCCCTGTTTGAGTATTACTCCCCCAAACCT
CTGTATTCAAGTTACTAATCTTCGGTGTGACATCTCTGCTAATCACACTTGCCACA
>Rank10_clean_2213:4:1101:7962:2142
CGGTCCACCGAGAAAGGATGCTCCCTCAAAGCCTCAGATAGCGAAGGTGGAGACAGGACAAAAGAAGAAACCCCCCCCCCCACCCCCCCCC
>Rank10_clean_2213:4:1101:8018:2112
GTGAAACGCCTCGCCGACTCTCTCCGCCACCCGGTAATAGCCGTGGGTGTACGGATCAAACGCAATGGCGTCCACAAGAGACATATCGACCTTGTCACCGGCCATGACGCGCTCGTCTGCCGTGACATTGACGACCTTGCCGATGACGCCGAC
>Rank10_clean_2213:4:1101:2807:2211
TGAAAGTTGACATAGGAACCTGTGGAAGCATTGTAGTTAATGAGCGTTTTTTTTAAGTCATCAAAGTTATTTTTTAAGTTATGACGGCGGATATAATCCTGGAACTTGGGATTGACTATCCATTTATCAAAACACTGATCAAGAACAGTGCTTTGAATAAGCTCAGGTGAAGCATTGACTT
CAAATCCTGGCATAACACCTACAAGATAGCCATATTTCTCAAGTAATGCCT
Я никогда не использовал СЭД или AWK до и я действительно смущен, как они работают, так что если кто-то может объяснить как сделать это, что было бы потрясающе.
Спасибо, Том
Что вы желаемый результат? – ShellFish
Обновлен вопрос, чтобы привести пример выхода fatsa – Tom
Если SAM и FASTA являются стандартными форматами, то вполне вероятно, что для этого уже есть инструменты. Возможно, стоит взглянуть на [BioPerl] (http://www.bioperl.org/wiki/HOWTO:Beginners), который может иметь что-то полезное встроенное. –