Я пытаюсь создать импровизатор import.io для этого сайта http://theaccelblog.squarespace.com/, но когда я нажимаю «далее», чтобы перейти на следующую страницу, чтобы получить поезд, он возвращает меня к первому из-за использования системы разбивки на страницы. Поблагодарю любые предложения о том, как заставить искателя import.io просканировать эти страницы. Как было предложено на сайте import.io, я попытался найти систему разбивки на страницы при обмене пакетами с сервером, но не удалось. Спасибо, если вы можете помочь. JRHimport.io crawler для нестандартной системы разбивки на страницы
1
A
ответ
0
Я использовал массовый экстракт для создания API.
https://import.io/data/mine/?id=bc7d67f2-24d3-4b5c-b134-01544430998a
Если вы используете пагинацию смещения ниже вы можете ввести его в налив и получить необходимые данные.
http://theaccelblog.squarespace.com/?offset=1418833411427
http://theaccelblog.squarespace.com/?offset=1409932229141
http://theaccelblog.squarespace.com/?offset=1402342675828
http://theaccelblog.squarespace.com/?offset=1397601000000
http://theaccelblog.squarespace.com/?offset=1397511000000
http://theaccelblog.squarespace.com/?offset=1390543200000
http://theaccelblog.squarespace.com/?offset=1375383600000
http://theaccelblog.squarespace.com/?offset=1359748800000
http://theaccelblog.squarespace.com/?offset=1285959600000
Спасибо,
Meg