2016-06-13 7 views
0

Краткая версия: Как узнать, как выражать дополнительные данные (например, определенные параметры на странице, отображающие разные html-файлы, но относящиеся к одному и тому же URL-адресу) при получении URL-адреса с urllib?Какие дополнительные данные необходимо отправить в запросе URL?

Длинная версия: У меня возникают проблемы, чтобы выяснить, как обрабатывать свойство запроса URL-адрес, которые не определяется URL Link но, возможно, другой информацией, которую ваш браузер обычно представляемый. Точнее: This page содержит таблицу, которую я хочу читать с помощью python, но длина таблицы зависит от количества элементов на странице, которую вы выбираете в левом нижнем углу (то есть количество элементов в коде, который я получаю от urllib.request.urlopen - это стандарт 50 или что-то, а не полная таблица). Нажатие на кнопки, например. 400 элементов на странице не меняют URL-адрес, поэтому я ожидаю, что какая-то информация отправлена ​​где-то еще. Я понимаю, что использование urllib может отправлять дополнительные данные, помимо URL-адреса, но мне непонятно, как определить, как я должен фраза «дать мне всю таблицу» (или «дать мне 400 элементов на страницу») в этих данных.

Изучение файла .html, который я получаю от сохранения веб-страницы в своем браузере, не дал мне никаких намеков, и я пропущу словарь для поиска ответов в Интернете (то есть, параметр запроса urllib «googling» слишком расплывчатый). Следовательно, я был бы полностью удовлетворен, если бы кто-то указал мне на дубликат этого вопроса.

Спасибо заранее :)

+0

информация, вероятно, хранить и отправлено в cookie. Осмотрите фактический запрос, отправленный в вашем браузере, используя инструменты отладки вашего браузера. – deceze

+0

@deceze Это может быть то, что я пытался, сохраняя страницу как html и работая через документ. (в хроме, который также работает с «источником просмотра», [эта ссылка может работать только в хроме] (view-source: http: //virtonomics.com/mary/main/geo/transport/423083/370074/423081/423082/ 423083).) Я не смог определить информацию, хотя, но я также не знаю точно, что я ищу. – SolUmbrae

+0

Я говорю об этом: https://developers.google.com/web/tools/chrome-devtools/profile/network-performance/resource-loading#view-details-for-a-single-resource - Вы хотите для репликации HTTP-запроса, поэтому посмотрите на исходный HTTP-запрос; а не HTML-документ. – deceze

ответ

-1

Это не возможно, потому что это URLS возвращает 302 response.It означает, что вы не можете получить различные значения из URL, потому что веб-содержимое создает сервер полностью

0

Для всех остальных найти этот вопрос Я уточнить ответ @deceze дал в комментариях:

  • Откройте веб-страницу вы хотите прочитать в вашем браузере
  • Откройте ваш браузер сети панель (в хром это [Strg + Shift + I] или щелкните правой кнопкой мыши> Inspect
  • Перейдите на вкладку «Сеть» (по крайней мере, в хроме)
  • Выполняйте все, что хотите, чтобы ваша программа выполнялась, а пустой список сетевых панелей заполнить с большим количеством данных
  • Найти свой запрос в списке событий (один из самых первых является правильным, я думаю), щелкните его и выберите «Заголовки»