2017-02-08 1 views
0

У меня есть столбец CSV-файл содержит:Удалить все строки после .txt

The_Guardian2017-01-30_17-44_part199.pdf.txt_00076 ___ 1486548173000___4982 The_Guardian2017-01-30_17-44_part286.pdf.txt_000D7 ___ 1486548174948___5316 The_Guardian2017-01 -30_17-44_part343.pdf.txt_00117 ___ 1486548176288___9737

............

Я хочу, чтобы удалить всю строку после

.txt

, чтобы выглядеть следующим образом:

The_Guardian2017-01-30_17-44_part199.pdf.txt

какие-либо предложения?

+0

https://regex101.com/r/tMwPH5/1 –

ответ

1

Поиск:

^(.*?\.txt).*$ 

Заменить:

$1 

выше решение будет работать из коробки в Notepad ++ и других подобных редакторов. Регулярное выражение соответствует и фиксирует все до сначала.txt, игнорируя все, что следует.

Demo here

+0

Это работает! Большое спасибо! – user2332706

0

Использование Python для того же.

import re 

text = "The_Guardian2017-01-30_17-44_part199.pdf.txt_00076___1486548173000___4982" 

#Method 1 
print(text.split('_0')[0]) 

#Method 2 
print(text[:-29]) 

#Method 3 
m = re.match('^(.*?\.txt)',text) 
print(m.group(1))