Я попытался использовать python для написания скрипта, удалив определенный узорный текст внутри html. Однако мой код, похоже, не работает. Не могли бы вы помочь мне проверить, где пошло не так?Удаление узорного текста из html с использованием python
import os, re
cwd = os.getcwd()
print ('Now you are at this directory: \n' + cwd)
# find files that have an extension with HTML
Files = os.listdir(cwd)
print Files
def func(file):
for file in os.listdir(cwd):
if file.endswith('.html'):
for line in open(file):
re.sub(r'<strong>.*?<\/strong>', '', line)
# I feel the above line has some problems
func(file)
спасибо, что заблаговременно !!
Спасибо Тьерри, я обязательно проверю прекрасное! Для регулярного выражения я пробовал оба шаблона, но ни один из них не работает ... Если вы используете мой оригинальный скрипт и пытаетесь распечатать согласованные тексты, они на самом деле правильны. Я просто не уверен, какая часть ошибочна в коде, который мешает мне заменять согласованные строки ... – Penny