2017-01-01 6 views
0

Я пробираюсь по этому пути (1).Scrapy не может найти паука

Я работаю в папку я создал в качестве Scrapy проекта из командной строки:

Пользователи/MyName/Desktop/MyProject/MyProject/Паук/MyProject_spider.py

Мои код

import [everything necessary] 

class myProjectSpider(CrawlSpider): 
    name = 'myProject' 
    allowed_domains = ['http://www.reddit.com/r/listentothis'] 
    start_urls = ['http://www.reddit.com/r/listentothis'] 
    rules = (Rule(LinkExtractor(allow=('http://www.reddit.com/r/listentothis/.+'), deny_domains=('www.youtube.com', 'www.soundcloud.com', 'www.reddit.com/user/.+')),'parse_start_url',follow=False),) 

    def parse_start_url(self, response): 
     hxs = HtmlXPathSelector(response) 
     title1 = hxs.select('class="Title"').extract(text) 
     yield request 

в командной строке, я перейти на рабочий стол> MyProject и введите

scrapy crawl myProject 

ошибка я всегда получаю

"Паук не найден: MyProject."

Я пробовал использовать разные имена (чтобы имя паук совпало с именем класса, что делает класс lame совпадающим с именем файла, что делает имя файла совпадающим с именем проекта и каждой комбинацией выше), и Я попытался вызвать команду из разных файлов в проекте.

+0

Да. Извините, эта точка - только опечатка. Не знаю, как это получилось. – litmuz

ответ

0

Из текущей папки, нужно запустить scrapy runspider MyProject_spider и если вы хотите, чтобы ползать вам нужно создать проект, разместить MyProject_Spider.py в каталоге паука, а затем перейти в каталог верхнего уровня и запустите scrapy crawl myProject.