Мне нужно зайти на сайт, чтобы получить доступ к его html на странице с защитой входа для проекта, который я делаю.Вход на сайт и извлечение HTML с помощью Python
Я использую this person's ответ со значениями мне нужно:
from twill.commands import *
go('https://example.com/login')
fv("3", "email", "[email protected]")
fv("3", "password", "mypassword")
submit()
предположительно это должно войти в меня так, то я бегу:
sock = urllib.urlopen("https://www.example.com/activities")
html_source = sock.read()
sock.close()
print html_source
Что я думал напечатать HTML из (сейчас), но вместо этого просто дает мне html страницы входа. Я пробовал другие методы (например, с помощью механизации), но получаю идентичный результат.
Что мне не хватает? Некоторые сайты ограничивают этот тип входа или не работают с https или что-то еще? (Сайт FitBit, так как я не мог использовать url в вопросе)
'twill! = Urllib' – falsetru
Вы пытались использовать« https://example.com/activities »(без« www »), используя' urllib'? Я столкнулся с проблемами, когда я смешиваю URL-адреса «www» и «www» ... –