2015-07-30 4 views
5

Я пытаюсь очистить список событий с сайта http://www.cityoflondon.gov.uk/events/, но при утилизации им с import.io я могу извлечь только первую страницу.Как очистить несколько страниц с помощью Import.io

Как я могу извлечь все страницы сразу?

+0

Я нашел этот курс на [Udemy] (https://www.udemy.com/how-to-extract-data-from-the-web), и это действительно помогло мне понять Import.io , особенно на лекции 3, где он объясняет больше о Гусенице. – Huander

ответ

3

Вы можете извлечь данные с этого сайта либо с помощью сканера, либо с помощью массового извлечения. Выше сайт использует очень просто форму пагинацией:

http://www.cityoflondon.gov.uk/events/Pages/default.aspx  
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=13  
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=49  
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=25  
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=37 

Вот набор данных, который я создал для этих URL-адресов, которые должны содержать всю необходимую информацию.

319aebad-88ea-4053-a649-2087011ce041

Если у вас есть дополнительные вопросы об отдельном веб-сайте, пожалуйста, свяжитесь с [email protected]

Спасибо! Meg

+1

Вау, большое спасибо, это прекрасно. – Huander

+1

Рад помочь! Просто обратитесь в службу поддержки, если вам понадобится что-нибудь еще в будущем. –