Feb 26, 2016, 10:02 AM

Самый простой способ запустить Scrapy Crawler, чтобы он не блокировал скрипт

Официальные документы дать много способов для бегаscrapy сканеры из кода:

import scrapy
from scrapy.crawler import CrawlerProcess

class MySpider(scrapy.Spider):
    # Your spider definition
    ...

process = CrawlerProcess({
    'USER_AGENT': 'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1)'
})

process.crawl(MySpider)
process.start() # the script will block here until the crawling is finished

Но все они блокируют скрипт до завершения сканирования. Какой самый простой способ в python запустить сканер неблокирующим, асинхронным способом?

Ответы на вопрос(2)

Популярные вопросы

0 ответов

Как удалить '/ public' из URL, используя htaccess для локального хоста и хост-сервера?

0 ответов

Segue между двумя контроллерами представления

0 ответов

Как я могу связать локальный неверсионный код с удаленным репозиторием git?

0 ответов

FIN против RST в TCP-соединениях

0 ответов

Лямбда-выражение для многих ко многим вещам в C # EF 5 Code First