Я использую модуль Pypandoc python. Код, который я использую для преобразования является:Как изменить HTML, выводимый pandoc при преобразовании из docx в HTML?
html = pypandoc.convert(
tmp_loc,
'html5',
extra_args=['--extract-media=']
)
Этот код преобразует DOCX в HTML, который хранится в «HTML» и в то же время извлекает изображения из DOCX и заносит их в хранилище медиа под названием image01 .jpg. IMG SRC в HTML является:
<img src="/media/image01.jpg" />
Теперь то, что я хочу сделать, это изменить имя изображения, то есть image01.jpg в более удобное имя. Я могу легко изменить имя изображения в репозитории. Но как мне обновить тег img src в HTML, выведенный pypandoc?
Спасибо
Спасибо. Я использовал Beautiful soup для изменения HTML. Это сработало. –
@ ArunabhGhosh отлично! то не стесняйтесь принимать и отстаивать ответ :) – mb21