2013-12-13 3 views
1

Действительно элементарный вопрос, но я не могу заставить это работать. Мой образец текста приведен в нижней части страницы.Найти и заменить следующий и следующий и не найти первый и последний

Единственная строка, которую я хочу оставить, это те, которые выглядят следующим образом: «178-207 30 WVRTRWALLLLFWLGWLGMLAGAVVIIVRA -3,95». В настоящее время я использую TextWrangler на OSX (терминал и меня не друзья), которые предоставляют регулярные выражения. Я пытаюсь сделать это пошагово, и мой первый шаг пытается избавиться от всех белковых последовательностей.

В TextWrangler, я ищу для этого:

Рабочая последовательность ([^;] *) ----------------------- -------------------------------------

и заменить ничем. Тем не менее, в итоге я почти пустой документ, поскольку TextWrangler, похоже, находит первый экземпляр «Working sequence», но LAST-экземпляр «----------------- -------------------------------------------». Как изменить, так что это пошаговый процесс, поиск первых экземпляров обоих и замена ничем, затем второй экземпляр и т. Д.?

Спасибо и привет из Швеции

Результаты сводной для белка: зр | P08195 | 4F2_HUMAN 4F2 GN = SLC3A2 PE = 1 SV = 3 транслокон TM Результаты анализа Partitioning: воды в бислое диапазона окна: 19-30

Количество транслокона ТМ предсказывал сегментов: 2

178-207 30 WVRTRWALLLLFWLGWLGMLAGAVVIIVRA -3,95

438-460 23 ARLLTSFLPAQLLRLYQLMLFTL 1,63

Рабочая длина последовательности = 630):

MELQPPEASIAVVSIPRQLPGShSEAGVQGLSAGDDSELGShCVAQTGLELLASGDPLPS ASQNAEMIETGSDCVTQAGLQLLASSDPPALASKNAEVTGTMSQDTEVDMKEVELNELEP EKQPMNAASGAAMSLAGAEKNGLVKIKVAEDEAEAAAAAKFTGLSKEELLKVAGSPGWVR TRWALLLLFWLGWLGMLAGAVVIIVRAPRCRELPAQKWWhTGALYRIGDLQAFQGhGAGN LAGLKGRLDYLSSLKVKGLVLGPIhKNQKDDVAQTDLLQIDPNFGSKEDFDSLLQSAKKK SIRVILDLTPNYRGENSWFSTQVDTVATKVKDALEFWLQAGVDGFQVRDIENLKDASSFL AEWQNITKGFSEDRLLIAGTNSSDLQQILSLLESNKDLLLTSSYLSDSGSTGEhTKSLVTQYLNATGNRWCSWSLSQARLLTSFLPAQLLRLYQLMLFTLPGTPVFSYGDEIGLDAAALP GQPMEAPVMLWDESSFPDIPGAVSANMTVKGQSEDPGSLLSLFRRLSDQRSKERSLLhGD FhAFSAGPGLFSYIRhWDQNERFLVVLNFGDVGLSAGLQASDLPASASLPAKADLLLSTQ PGREEGSPLELERLKLEPhEGLLLRFPYAA


Краткое изложение результатов для белка: зр | Q9NPC4 | A4GAT_HUMAN ОС = гомо сапиенс Г.Н. = A4GALT РЕ = 2 SV = 1 транслокона ТМ Результаты анализа Секционирование: вода бислой Диапазон окон: 19-30

Количество сегментов транслокона ТМ: 1

19-43 25 RVCTLFIIGFKFTFFVSIMIYWhVV -1,04

Рабочая длина последовательности = 353):

MSKPPDLLLRLLRGAPRQRVCTLFIIGFKFTFFVSIMIYWhVVGEPKEKGQLYNLPAEIP CPTLTPPTPPShGPTPGNIFFLETSDRTNPNFLFMCSVESAARThPEShVLVLMKGLPGG NASLPRhLGISLLSCFPNVQMLPLDLRELFRDTPLADWYAAVQGRWEPYLLPVLSDASRI ALMWKFGGIYLDTDFIVLKNLRNLTNVLGTQSRYVLNGAFLAFERRhEFMALCMRDFVDh YNGWIWGhQGPQLLTRVFKKWCSIRSLAESRACRGVTTLPPEAFYPIPWQDWKKYFEDIN PEELPRLLSATYAVhVWNKKSQGTRFEATSRALLAQLhARYCPTThEAMKMYL


ответ

2

Вы сказали, что искали «рабочую последовательность» и все, что не является; первая (и следующая и следующая ...) строка символов «-» не является. Вот почему все это соответствует. Он соответствует последней строке символов «-», потому что вы сказали, что в конце должен быть один. Я думаю, что это сработает для вас

Working sequence([^-]*)------------------------------------------------------------ 

 Смежные вопросы

  • Нет связанных вопросов^_^