Результаты поиска по запросу "scrapy"

1 ответ

как получить оригинальный start_url в scrapy (до перенаправления)

Я использую Scrapy, чтобы сканировать некоторые страницы. Я получаю start_urls из листа Excel, и мне нужно сохранить URL-адрес в элементе. class abc_Spider(BaseSpider): name = 'abc' allowed_domains = ['abc.com'] wb = xlrd.open_workbook(path + ...

4 ответа

Передайте Scrapy Spider список URL для сканирования через .txt файл

Я немного новичок в Python и очень плохо знаком с Scrapy. Я настроил паука для сканирования и извлечения всей необходимой мне информации. Однако мне нужно передать .txt файл URL-адресов в переменную start_urls. Например: class ...

1 ответ

PYTHON SCRAPY не может отправить информацию в формы,

Я думаю, что я попрошу очень большую услугу, поскольку я боролся с этой проблемой несколько дней. Я перепробовал все возможные (насколько мне известно) способы и до сих пор не дал результата. Я делаю что-то не так, но все еще не могу понять, что ...

ТОП публикаций

1 ответ

Как вырезать текст, включенный между различными тегами, используя scrapy

Я пытаюсь удалить описание продукта из этогоссылка [http://www.yebhi.com/94208/PD/puma-white-men-sneakers.htm], Но как мне удалить весь текст, включая текст между теги. Вот объект hxshxs.select('//div[@class="overview"]/div/text()').extract() но ...

2 ответа

Соскрести данные из таблицы с помощью скрапа

Соскрести данные из таблицы с помощью скрапа. HTML-таблица выглядит так: <table class="tablehd"> <tr class="colhead"> <td width="170">MON, NOV 11</td> <td width="80">Item</td> <td width="60" align="center"></td> <td width="210">Item</td> <td ...

4 ответа

Scrap Run паук из сценария

Я хочу запустить мой паук из сценария, а не

1 ответ

Как автоматически получить URL AJAX-звонки?

Цель состоит в том, чтобы запрограммировать сканер, способный:1) Получить URL-адреса ссылок, которые находятся в таблице этой страницы:http://cordis.europa.e...

2 ответа

Интенсивный процессорный анализ с помощью scrapy

Раздел CONCURRENT_ITEMS вhttp://doc.scrapy.org/en/latest/topics/settings.html#concurrent-items определяет это как:Максимальное количество одновременных элеме...

9 ответов

Как использовать PyCharm для отладки проектов Scrapy

Я работаю над Scrapy 0.20 с Python 2.7. Я обнаружил, что у PyCharm есть хороший отладчик Python. Я хочу проверить своих пауков Scrapy, используя это. Кто-ниб...

3 ответа

Как очистить куки в скрапе?

По умолчанию Scrapy хранит и передает файлы cookie по запросам. Но как мне получить доступ или очистить сохраненные куки в определенный момент в пауке? Спасибо?