Действительно элементарный вопрос, но я не могу заставить это работать. Мой образец текста приведен в нижней части страницы.Найти и заменить следующий и следующий и не найти первый и последний
Единственная строка, которую я хочу оставить, это те, которые выглядят следующим образом: «178-207 30 WVRTRWALLLLFWLGWLGMLAGAVVIIVRA -3,95». В настоящее время я использую TextWrangler на OSX (терминал и меня не друзья), которые предоставляют регулярные выражения. Я пытаюсь сделать это пошагово, и мой первый шаг пытается избавиться от всех белковых последовательностей.
В TextWrangler, я ищу для этого:
Рабочая последовательность ([^;] *) ----------------------- -------------------------------------
и заменить ничем. Тем не менее, в итоге я почти пустой документ, поскольку TextWrangler, похоже, находит первый экземпляр «Working sequence», но LAST-экземпляр «----------------- -------------------------------------------». Как изменить, так что это пошаговый процесс, поиск первых экземпляров обоих и замена ничем, затем второй экземпляр и т. Д.?
Спасибо и привет из Швеции
Результаты сводной для белка: зр | P08195 | 4F2_HUMAN 4F2 GN = SLC3A2 PE = 1 SV = 3 транслокон TM Результаты анализа Partitioning: воды в бислое диапазона окна: 19-30
Количество транслокона ТМ предсказывал сегментов: 2
178-207 30 WVRTRWALLLLFWLGWLGMLAGAVVIIVRA -3,95
438-460 23 ARLLTSFLPAQLLRLYQLMLFTL 1,63
Рабочая длина последовательности = 630):
MELQPPEASIAVVSIPRQLPGShSEAGVQGLSAGDDSELGShCVAQTGLELLASGDPLPS ASQNAEMIETGSDCVTQAGLQLLASSDPPALASKNAEVTGTMSQDTEVDMKEVELNELEP EKQPMNAASGAAMSLAGAEKNGLVKIKVAEDEAEAAAAAKFTGLSKEELLKVAGSPGWVR TRWALLLLFWLGWLGMLAGAVVIIVRAPRCRELPAQKWWhTGALYRIGDLQAFQGhGAGN LAGLKGRLDYLSSLKVKGLVLGPIhKNQKDDVAQTDLLQIDPNFGSKEDFDSLLQSAKKK SIRVILDLTPNYRGENSWFSTQVDTVATKVKDALEFWLQAGVDGFQVRDIENLKDASSFL AEWQNITKGFSEDRLLIAGTNSSDLQQILSLLESNKDLLLTSSYLSDSGSTGEhTKSLVTQYLNATGNRWCSWSLSQARLLTSFLPAQLLRLYQLMLFTLPGTPVFSYGDEIGLDAAALP GQPMEAPVMLWDESSFPDIPGAVSANMTVKGQSEDPGSLLSLFRRLSDQRSKERSLLhGD FhAFSAGPGLFSYIRhWDQNERFLVVLNFGDVGLSAGLQASDLPASASLPAKADLLLSTQ PGREEGSPLELERLKLEPhEGLLLRFPYAA
Краткое изложение результатов для белка: зр | Q9NPC4 | A4GAT_HUMAN ОС = гомо сапиенс Г.Н. = A4GALT РЕ = 2 SV = 1 транслокона ТМ Результаты анализа Секционирование: вода бислой Диапазон окон: 19-30
Количество сегментов транслокона ТМ: 1
19-43 25 RVCTLFIIGFKFTFFVSIMIYWhVV -1,04
Рабочая длина последовательности = 353):
MSKPPDLLLRLLRGAPRQRVCTLFIIGFKFTFFVSIMIYWhVVGEPKEKGQLYNLPAEIP CPTLTPPTPPShGPTPGNIFFLETSDRTNPNFLFMCSVESAARThPEShVLVLMKGLPGG NASLPRhLGISLLSCFPNVQMLPLDLRELFRDTPLADWYAAVQGRWEPYLLPVLSDASRI ALMWKFGGIYLDTDFIVLKNLRNLTNVLGTQSRYVLNGAFLAFERRhEFMALCMRDFVDh YNGWIWGhQGPQLLTRVFKKWCSIRSLAESRACRGVTTLPPEAFYPIPWQDWKKYFEDIN PEELPRLLSATYAVhVWNKKSQGTRFEATSRALLAQLhARYCPTThEAMKMYL