Краткая версия: Как узнать, как выражать дополнительные данные (например, определенные параметры на странице, отображающие разные html-файлы, но относящиеся к одному и тому же URL-адресу) при получении URL-адреса с urllib?Какие дополнительные данные необходимо отправить в запросе URL?
Длинная версия: У меня возникают проблемы, чтобы выяснить, как обрабатывать свойство запроса URL-адрес, которые не определяется URL Link но, возможно, другой информацией, которую ваш браузер обычно представляемый. Точнее: This page содержит таблицу, которую я хочу читать с помощью python, но длина таблицы зависит от количества элементов на странице, которую вы выбираете в левом нижнем углу (то есть количество элементов в коде, который я получаю от urllib.request.urlopen - это стандарт 50 или что-то, а не полная таблица). Нажатие на кнопки, например. 400 элементов на странице не меняют URL-адрес, поэтому я ожидаю, что какая-то информация отправлена где-то еще. Я понимаю, что использование urllib может отправлять дополнительные данные, помимо URL-адреса, но мне непонятно, как определить, как я должен фраза «дать мне всю таблицу» (или «дать мне 400 элементов на страницу») в этих данных.
Изучение файла .html, который я получаю от сохранения веб-страницы в своем браузере, не дал мне никаких намеков, и я пропущу словарь для поиска ответов в Интернете (то есть, параметр запроса urllib «googling» слишком расплывчатый). Следовательно, я был бы полностью удовлетворен, если бы кто-то указал мне на дубликат этого вопроса.
Спасибо заранее :)
информация, вероятно, хранить и отправлено в cookie. Осмотрите фактический запрос, отправленный в вашем браузере, используя инструменты отладки вашего браузера. – deceze
@deceze Это может быть то, что я пытался, сохраняя страницу как html и работая через документ. (в хроме, который также работает с «источником просмотра», [эта ссылка может работать только в хроме] (view-source: http: //virtonomics.com/mary/main/geo/transport/423083/370074/423081/423082/ 423083).) Я не смог определить информацию, хотя, но я также не знаю точно, что я ищу. – SolUmbrae
Я говорю об этом: https://developers.google.com/web/tools/chrome-devtools/profile/network-performance/resource-loading#view-details-for-a-single-resource - Вы хотите для репликации HTTP-запроса, поэтому посмотрите на исходный HTTP-запрос; а не HTML-документ. – deceze