Я пытаюсь ввести файл в scrapy для обработки. Но я не знаю, почему у меня возникает проблема с вводом в формат файла. Вот то, что я пробовал:Ввод файла для вопросов, связанных с очисткой
with open("url.txt","r") as f:
DOMAIN = [u.strip() for u in f.readlines()]
print DOMAIN
URL = 'http://%s' % DOMAIN
class MySpider(scrapy.Spider):
name = "emailextractor"
allowed_domains = [DOMAIN]
start_urls = [
URL
]
Входной файл в этом формате:
emaxple.com
example.net
example.org.... etc
Как внести вклад в Scrapy в формате, который я использую. Я пытаюсь добавить http://
ко всем URL, которые я буду кормить. Даже файл очень большой в Великобритании. Итак, что мне лучше делать? Пожалуйста, помогите мне.
Этот вопрос не работает для меня: Pass input file to scrapy containing a list of domains to be scraped