Я пытаюсь создать программу, которая ежедневно захватывает мои школьные оценки с сайта. Затем сохраняет значения и создает график для моих оценок, но когда я пытаюсь очистить страницу, HTML, который я получаю, отличается от HTML, который я получаю с элементом проверки.Webscraping my grades
from urllib.request import urlopen
from bs4 import BeautifulSoup
html = urlopen("https://ames.usoe-dcs.org/Students/2567")
bsObj = BeautifulSoup(html.read(), 'lxml');
print(bsObj)
инспектировать элемент дает мне: http://pastebin.com/BakmpqUM
в то время как питон дает мне: http://pastebin.com/7gPY1WgB
я понять это, потому что URL в моих классах (https://ames.usoe-dcs.org/Students/2567) является частным, поэтому при вводе его в браузер возвращает меня здесь: https://ames.usoe-dcs.org/Login/?DestinationURL=%2FStudents%2F2566
есть ли способ использовать python для автоматического входа в систему?
Вам нужно будет выяснить, как сайт позволяет вам пройти аутентификацию в браузере. Например, когда вы входите в систему с вашим именем пользователя/паролем успешно, ответ HTTP, скорее всего, возвращается с заголовком «Set-Cookie», который вам необходимо передать вместе со всеми вашими последующими HTTP-запросами. – ryannjohnson
Если сайт никогда не выйдет из системы, вы можете просто сохранить файл cookie со своим скриптом (вместо вашего имени пользователя и пароля). – ryannjohnson