2016-12-06 4 views
1

Я могу создать веб-страницу, без проблем. Я могу сохранить веб-страницу ... как html, без проблем. Мне нужно сохранить веб-страницу как mht, чтобы я мог получить весь html, который будет скрыт без сохранения как mht. В исследовании я не придумываю абсолютно ничего о том, как сохранить как mht с помощью python. Как я уже сказал выше, я могу попытаться сохранить его как файл mht, используя стандартную кодировку для сохранения как html, но это просто не работает ... не удивляет, что это тоже не сработает, но это того стоило.Python, save as mht

url = 'https://www.thewebsite.com' 
html = urllib.request.urlopen(url).read() 

m = open('websitetest.mht', 'w') 
m.write(str(html)) 
m.close() 

На сайте я пытаюсь сохранить делает «скрытый код», который попадается при сохранении в МХТ, но не тогда, когда сохраняется как HTML. Следовательно, почему я пытаюсь сохранить как mht, поэтому я получаю весь код, а затем могу пройти через код, чтобы снять то, что мне нужно, чтобы скомпилировать базу данных.

+0

Вы сделали какие-либо исследования? Кажется, есть несколько инструментов, которые делают это. – jonrsharpe

+0

Посмотрев здесь на stackoverflow и набрав «файл python mht», вы получили всего пару результатов, которые были далеки от того, что я хотел сделать. – confused

+0

@jonrsharpe Так что это за инструменты? – user1712447

ответ

0

Существует очень удобный проект Github, закодированный в Python 2.7 (вам нужно внести простые изменения, чтобы сделать его совместимым с Python 3.4). Этот проект имеет код для упаковки/распаковки файлов MHT. Я думаю, что это то, что вы ищете:

Un/packs an MHT (MHTML) archive into/from separate files, writing/reading them in directories to match their Content-Location.

 Смежные вопросы

  • Нет связанных вопросов^_^