2017-02-15 14 views
0

Что я делаю неправильно? Раньше у меня были скребковые сайты, но эта полезная нагрузка оказалась для меня трудной.Запросы Python Как правильно использовать полезную нагрузку после запроса

enter image description here

from requests import session 
from bs4 import BeautifulSoup as bs 

payload = { 
    "p_flow_id" : 838 , 
    "p_flow_step_id": 4 , 
    "p_instance" :1282563643133 , 
    "p_page_submission_id" :4990502617229, 
    "p_request" : "" 
} 


with session() as c: 
    c.post('http://nid.usace.army.mil/cm_apex/f?p=838:4:0::NO/wwv_flow.accept', data=payload) 
    url = c.get('http://nid.usace.army.mil/cm_apex/f?p=838:4:0::NO/wwv_flow.accept') 
    html = url.content 
    soup = bs(html) 
+1

Вы могли бы хотеть добавить попробовать/за исключением проверки, если запрос возвращает 200 или нет, и обработать исключение, если это Безразлично «т. – cbll

ответ

0

Ваш первый возвращает запрос с 404 ошибкой:

from bs4 import BeautifulSoup as bs 

payload = { 
    "p_flow_id" : 838 , 
    "p_flow_step_id": 4 , 
    "p_instance" :1282563643133 , 
    "p_page_submission_id" :4990502617229, 
    "p_request" : "" 
    } 


with session() as c: 
    print 'in' 
    r1 = c.post('http://nid.usace.army.mil/cm_apex/f?p=838:4:0::NO/wwv_flow.accept', data=payload) 
    print r1.status_code # 404 
    url = c.get('http://nid.usace.army.mil/cm_apex/f?p=838:4:0::NO/wwv_flow.accept') 
    html = url.content 
    soup = bs(html,'lxml') 
    print soup