2010-11-24 2 views
2

У меня есть url для синтаксического анализа, и они использовали некоторый javascript для его динамического создания. Так что, если я хочу разобрать результат сгенерированной страницы с помощью python ... как я могу это сделать?Как увидеть сгенерированный исходный код со страницы URL с скриптом python и не источником?

Firefox сделать это хорошо с веб-разработчик ... так что я думаю, что это возможно ... но я не знаю, с чего начать ...

Thx за помощью

ло

ответ

2

Я сделал это, выполнив POST документа document.body.innerHTML после загрузки страницы в CGI-скрипт в Python.

Для синтаксического анализа BeautifulSoup является хорошим выбором.

+0

хм, поскольку я перечитывал вопрос, это не ваши страницы, о которых вы говорите, они чужие. этот трюк может по-прежнему работать, если вы загружаете страницы других в iframe. – 2010-11-24 07:08:49

0

Я хочу, чтобы сгенерированный источник вам понадобился браузер, я не думаю, что вы можете использовать только python.