2016-04-05 3 views
2

Я использую import.io для извлечения большого количества данных из сотен веб-страниц. Я уже создал экстракторы для этих URL-адресов и все еще добавляю больше.Как загрузить все экстракторы вместе с конечными точками для запроса RESTful?

Я разработал автоматизированный процесс, который рекурсивно отправляет HTTP-запрос API-интерфейса import.io RESTful для всех экстракторов.

Каждый раз, когда я создаю новый экстрактор, я выполняю ручную задачу, чтобы вставить конечную точку вновь созданного экстрактора в мою базу данных. Этот подход очень трудоемкий и может быть подвержен ошибкам, так как существует вероятность ошибки копирования/вставки.

Хотя import.io ведет список моих данных, я бы с удовольствием загрузил все экстракторы вместе с их конечными точками для запроса RESTful, чтобы данные могли храниться в моей базе данных.

Есть ли способ загрузить или извлечь все мои данные в формат excel или какой-либо другой?

ответ

2

В настоящее время я не боюсь загружать API-интерфейсы API для всех ваших экстракторов.

С помощью этого метода можно получить идентификаторы GUID ваших разъемов.

http://api.docs.import.io/legacy/#ConnectorMethods «поиск разъемы»

Вы могли бы написать небольшой скрипт в Python, например, чтобы разобрать это, чтобы получить GUIDs.

Потенциально вы можете добавить это в свой автоматический процесс.

+0

Спасибо Alex! Мне удалось получить список моих экстракторов в соответствии с вашим предложением. Но я хотел бы предложить import.io включить эту функцию для массового скачивания конечных точек API через приложение. –

+0

Это хорошая идея! Я собираюсь передать это команде import.io. :) –

 Смежные вопросы

  • Нет связанных вопросов^_^