Результаты поиска по запросу "scrapy"

1 ответ

Сканирование на несертифицированный сайт

Я новичок в Python и Scrapy, но я пытаюсь получить некоторые данные с веб-сайта, который имеет ненадежный сертификат, и я думаю, именно поэтому я не могу его сканировать, хотя, возможно, я просто сделал паука неправильно Вот журнал ошибок, ...

3 ответа

это рабочий код, пожалуйста попробуйте:

жен очистить все фильмы с этой страницы IMDb: https://www.imdb.com/list/ls055386972/ [https://www.imdb.com/list/ls055386972/]. Мой подход в первую очередь, чтобы очистить все значения<a href="/title/tt0068646/?ref_=ttls_li_tt" ...

1 ответ

UnicodeEncodeError после установки настроек restrict_xpaths

Я новичок в питоне и скрапе. После установки параметров restrict_xpaths в "// table [@ class =" lista "]" я получил следующую трассировку. Что странно, при использовании другого правила xpath сканер работает правильно. Traceback (most recent ...

ТОП публикаций

2 ответа

 и BeatifulSoup, чтобы загрузить вторую страницу вручную, извлечь эту информацию самостоятельно и сохранить ее как часть элемента. Да, гораздо больше неприятностей, чем при обычном синтаксическом анализе, но он должен выполнять работу с наименьшими хлопотами.

я есть вопрос о том, как сделать это в скрапе. У меня есть паук, который ползет по списку страниц предметов. Каждый раз, когда найдена страница листинга с элементами, существует обратный вызов parse_item (), который вызывается для извлечения ...

1 ответ

Python логическая операция

Я довольно новичок в Python, и я работаю над проектом по очистке веб-страниц с использованием библиотеки Scrapy. Я не использую встроенное ограничение домена, потому что хочу проверить, не устарела ли какая-либо из ссылок на страницы за пределами ...

1 ответ

Исправлена ​​неработающая ссылка @wrongusername.

apy Docsесть следующий пример, чтобы проиллюстрировать, как использовать аутентифицированный сеанс в Scrapy: [https://doc.scrapy.org/en/latest/topics/request-response.html#using-formrequest-from-response-to-simulate-a-user-login] У меня это ...

4 ответа

тогда была вызвана функция разбора.

мпредыдущий вопрос [https://stackoverflow.com/q/5850755/445210]Я не был очень конкретным в отношении моей проблемы (соскоб с аутентифицированного сеанса в Scrapy) в надежде вывести решение из более общего ответа. Наверное, мне следовало бы ...

7 ответов

Разница между BeautifulSoup и Scrapy Crawler?

Я хочу сделать сайт, который показывает сравнение между Amazon и E-Bay цены продукта. Что из этого будет работать лучше и почему? Я немного знаком с BeautifulSoupно не так много сScrapy гусеничный.

2 ответа

Я переписываю код, меняя, в thumb_path def, «ответ». по запросу.". Если нет, это не сработает, потому что «response установлен на None».

еняSCRAPY [http://doc.scrapy.org/index.html]Проект, который я в настоящее время используюImagesPipeline [http://doc.scrapy.org/topics/images.html#scrapy.contrib.pipeline.images.ImagesPipeline] , Загруженные изображенияхранится с хешем ...

5 ответов

Написать в файл CSV Scrapy

Я хочу написать в CSV-файл в Scrapy for rss in rsslinks: item = AppleItem() item['reference_link'] = response.url base_url = get_base_url(response) item['rss_link'] = urljoin_rfc(base_url,rss) #item['rss_link'] = rss items.append(item) ...