Результаты поиска по запросу "scrapy"

2 ответа

Сохранение разрывов строк при разборе с Scrapy в Python

Я написал паука Scrapy, который извлекает текст со страницы. Паук анализирует и выводит правильно на многих страницах, но некоторые сбрасывают. Я пытаюсь сохранить разрывы строк и форматирование в документе. Страницы, такие ...

7 ответов

Перебор словаря в python и удаление пробелов

Я работаю со Scraping-фреймворком в Интернете, и я немного новичок, когда дело доходит до Python. Поэтому мне интересно, как мне перебрать все очищенные элементы, которые, кажется, есть в словаре, и убрать пробел из каждого. Вот код, с которым я ...

6 ответов

Scrapy start_urls

Сценарий [https://github.com/scrapy/dirbot/blob/master/dirbot/spiders/dmoz.py] (ниже) изэто [http://doc.scrapy.org/en/latest/intro/tutorial.html]учебник содержит дваstart_urls. from scrapy.spider import Spider from scrapy.selector import ...

ТОП публикаций

2 ответа

Python Scrapy получить HREF, используя CSS селектор

Я хочу получить значение href. Я попробовал это: Link = Link1.css('span[class=title] a::text').extract()[0]но я просто получаю текст внутри<a>. как я могу получить ссылку внутри href, пожалуйста

3 ответа

Scrapy: перейдите по ссылке, чтобы получить дополнительные данные об элементе?

У меня нет конкретной проблемы с кодом, я просто не уверен, как логически решить следующую проблему с помощью платформы Scrapy: Структура данных, которые я хочу очистить, обычно представляет собой строку таблицы для каждого элемента. Достаточно ...

1 ответ

Могу ли я выполнить scrapy (python) обход за пределами проекта dir?

Документы говорят, что я могу выполнить только команду crawl внутри директории проекта: scrapy crawl tutor -o items.json -t jsonно мне действительно нужно выполнить его в моем коде Python (файл Python не находится внутри директории текущего ...

2 ответа

Scrap разрешить все домены

Я виделэто [https://stackoverflow.com/questions/6320167/python-scrapy-allowed-domains-adding-new-domains-from-database] опубликовать, чтобы scrap сканировал любой сайт без ограничения разрешенных доменов. Есть ли лучший способ сделать это, ...

1 ответ

scrapy convert_image

Я использую Scrapy, чтобы сканировать некоторые изображения, изображения должны вырезать часть или добавить водяной знак. Я перезаписываю функциюconvert_image вpipelines.py но это не сработало. Код выглядит так: class ...

5 ответов

Создание общего паука-скрапа

Мой вопрос на самом деле, как сделать то же самое, что и предыдущий вопрос, но в Scrapy 0.14. Использование одного паука Scrapy для нескольких сайтов [https://stackoverflow.com/questions/2396529/using-one-scrapy-spider-for-several-websites] По ...

2 ответа

Scrapyd's Scrapyd слишком медленный с планированием пауков

Я использую Scrapyd и сталкиваюсь со странной проблемой при запуске 4 пауков одновременно. 2012-02-06 15:27:17+0100 [HTTPChannel,0,127.0.0.1] 127.0.0.1 - - [06/Feb/2012:14:27:16 +0000] "POST /schedule.json HTTP/1.1" 200 62 ...