Я не знаю какого-либо существующего инструмента, который позволит вам это сделать, поэтому вам, вероятно, потребуется написать собственный скрипт для решения этой задачи.
Для этого вы можете использовать библиотеку, например Selenium. Используя это, вы даже можете выбрать, какой браузер вы хотите использовать для рендеринга веб-сайта.
Если вы работаете в Linux, я могу также порекомендовать для этого свой собственный проект webkit-scraping (эта рекомендация, конечно, немного предвзята;). Он использует экземпляр Webkit в памяти для визуализации страницы и выполнения Javascript в ней. После компиляции сервера с cd webkit-server && qmake && make
, вы можете сделать что-то подобное в Python:
import os, sys
sys.path.insert(0, '/path/to/webkit-scraping/lib')
import webkit_scraping
URL = 'http://example.org'
OUTFILE = '/tmp/example.html'
if __name__ == '__main__':
# set up a web scraping session
driver = webkit_scraping.webkit_server.Driver()
sess = webkit_scraping.scraping.Session(driver = driver)
sess.visit(URL)
with open(OUTFILE, 'wb') as f:
f.write(sess.body())
Насколько я знаю, нет таких инструментов программно будет делать что – Raghav
Какой язык вы предпочитаете? Или вам нужно приложение? – tryme
Моя цель? Отладка вашего JS или просмотр того, что делает JS на чужой странице? –