2015-08-30 6 views
1

Я пытаюсь создать импровизатор import.io для этого сайта http://theaccelblog.squarespace.com/, но когда я нажимаю «далее», чтобы перейти на следующую страницу, чтобы получить поезд, он возвращает меня к первому из-за использования системы разбивки на страницы. Поблагодарю любые предложения о том, как заставить искателя import.io просканировать эти страницы. Как было предложено на сайте import.io, я попытался найти систему разбивки на страницы при обмене пакетами с сервером, но не удалось. Спасибо, если вы можете помочь. JRHimport.io crawler для нестандартной системы разбивки на страницы

ответ

0

Я использовал массовый экстракт для создания API.

https://import.io/data/mine/?id=bc7d67f2-24d3-4b5c-b134-01544430998a

Если вы используете пагинацию смещения ниже вы можете ввести его в налив и получить необходимые данные.

http://theaccelblog.squarespace.com/?offset=1418833411427  
http://theaccelblog.squarespace.com/?offset=1409932229141  
http://theaccelblog.squarespace.com/?offset=1402342675828  
http://theaccelblog.squarespace.com/?offset=1397601000000  
http://theaccelblog.squarespace.com/?offset=1397511000000  
http://theaccelblog.squarespace.com/?offset=1390543200000  
http://theaccelblog.squarespace.com/?offset=1375383600000  
http://theaccelblog.squarespace.com/?offset=1359748800000  
http://theaccelblog.squarespace.com/?offset=1285959600000 

Спасибо,
Meg