Я пытаюсь обрабатывать некоторые данные, но я не могу найти рабочее решение для своей проблемы. У меня есть файл, который выглядит как:Удаление строк с более чем 30% строчными буквами
>ram
cacacacacacacacacatatacacatacacatacacacacacacacacacacacacaca
cacacacacacacaca
>pam
GAATGTCAAAAAAAAAAAAAAAAActctctct
>sam
AATTGGCCAATTGGCAATTCCGGAATTCaattggccaattccggaattccaattccgg
and many lines more....
Я хочу, чтобы отфильтровать все строки и соответствующие заголовки (заголовок начинается с>), где строка последовательности (те, которые не начинаются с>) является содержащими 30 или более процентами строчные буквы. И последовательности строк могут охватывать несколько строк.
Таким образом, после команды ху вывод должен выглядеть следующим образом:
>pam
GAATGTCAAAAAAAAAAAAAAAAActctctct
Я пробовал некоторые микс из цикла в то время как для чтения входного файла, а затем работать с AWK, Grep, СЭД, но не было хорошим результатом.
Вы попытались и не смогли это сделать? покажите нам свои усилия. – Inian
Также 'bash' не подходит для этого, так как он не может оценить значение с плавающей запятой для вычисления и сравнения.Вы можете очень хорошо удалить тег 'bash' – Inian