Как я могу отправить очищенные URL от одного паука до start_urls
другого паука?Пропустить очищенные URL от одного паука до другого
В частности, я хочу запустить один паук, который получает список URL-адресов с XML-страницы. После того, как URL-адрес был получен, я хочу, чтобы они использовались другим пауком для очистки.
from scrapy.spiders import SitemapSpider
class Daily(SitemapSpider):
name = 'daily'
sitemap_urls = ['http://example.com/sitemap.xml']
def parse(self, response):
print response.url
# How do I send these URL's to another spider instead?
yield {
'url': response.url
}
Было бы более разумно, если бы вы сделали все это в одном пауке. Каковы ваши аргументы в пользу использования двух пауков? –