2016-03-24 9 views
0

Я любезно застрял в этой проблеме! У меня массивный текстовый файл (3 миллиона строк или около того), и мне нужно удалить строки, содержащие более одной тильды. Может ли кто-нибудь быть таким добрым, чтобы помочь мне! Пожалуйста и спасибо .Линии, удаляющие питон, которые содержат более одной тильды

Вот то, что я до сих пор:

import re 

f_in = 'C:\\Users\\John\\Documents\\Python\\Pagelinks\\pagelinkSample_10K_cleaned2.txt' 

f_out = 'C:\\Users\\John\\Documents\\Python\\Pagelinks\\pagelinkSample_10K_cleaned3.txt' 

with open(f_in, 'r') as fin: 

     with open(f_out, 'w') as fout: 

       for line in fin: 

застрял здесь, я имею в виду, если количество строк для тильды содержит более одного удаления строки?

Спасибо!

+2

Зачем использовать python, когда 'grep -v '~~'' выполняет эту работу? –

ответ

3
for line in fin: 
    if line.count('~') < 2: 
     fout.write(line) 
+3

Предложение: 'if line.count ('~') <2:' и удалить 'continue'. –

+0

Да, намного лучше. –

 Смежные вопросы

  • Нет связанных вопросов^_^