Я пытаюсь очистить список событий с сайта http://www.cityoflondon.gov.uk/events/, но при утилизации им с import.io я могу извлечь только первую страницу.Как очистить несколько страниц с помощью Import.io
Как я могу извлечь все страницы сразу?
Я пытаюсь очистить список событий с сайта http://www.cityoflondon.gov.uk/events/, но при утилизации им с import.io я могу извлечь только первую страницу.Как очистить несколько страниц с помощью Import.io
Как я могу извлечь все страницы сразу?
Вы можете извлечь данные с этого сайта либо с помощью сканера, либо с помощью массового извлечения. Выше сайт использует очень просто форму пагинацией:
http://www.cityoflondon.gov.uk/events/Pages/default.aspx
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=13
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=49
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=25
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=37
Вот набор данных, который я создал для этих URL-адресов, которые должны содержать всю необходимую информацию.
319aebad-88ea-4053-a649-2087011ce041
Если у вас есть дополнительные вопросы об отдельном веб-сайте, пожалуйста, свяжитесь с [email protected]
Спасибо! Meg
Вау, большое спасибо, это прекрасно. – Huander
Рад помочь! Просто обратитесь в службу поддержки, если вам понадобится что-нибудь еще в будущем. –
Я нашел этот курс на [Udemy] (https://www.udemy.com/how-to-extract-data-from-the-web), и это действительно помогло мне понять Import.io , особенно на лекции 3, где он объясняет больше о Гусенице. – Huander