Результаты поиска по запросу "web-scraping"

3 ответа

Есть ли в скрипте Google Apps что-то вроде getElementById?

Я собираюсь использовать Google App Script для получения списка программ с сайта радиостанции. Как я могу выбрать указанные элементы на веб-странице, указав идентификатор элемента? Поэтому я могу получить программы на веб-странице.

3 ответа

Есть ли какой-нибудь метод использования отдельного конвейера для каждого паука?

Я хочу получать веб-страницы в другом домене, это означает, что я должен использовать другого паука под командой «scrap crawl myspider». Однако мне приходится использовать другую конвейерную логику для помещения данных в базу данных, поскольку ...

5 ответов

Ошибка Python Selen при попытке запустить Firefox

Я получаю сообщение об ошибке при попытке открыть Firefox с помощью Selenium в ноутбуке ipython. Я посмотрел вокруг и нашел похожие ошибки, но ничего, что точно соответствует ошибке, которую я получаю. Кто-нибудь знает, в чем может быть проблема ...

ТОП публикаций

4 ответа

Ускорьте веб-скребок

Я очищаю 23770 веб-страниц с помощью довольно простого веб-скребка, используяscrapy, Я довольно новичок в scrapy и даже в python, но мне удалось написать паука, который делает эту работу. Это, однако, очень медленно (для сканирования 23770 ...

1 ответ

Очистка веб-страницы, ссылок на страницу и формирование таблицы с помощью R

Здравствуйте, я новичок в использовании R для очистки данных из Интернета и, к сожалению, мало знаю о HTML и XML. Пытаюсь почистить каждую ссылку на историю на следующей родительской ...

1 ответ

как получить оригинальный start_url в scrapy (до перенаправления)

Я использую Scrapy, чтобы сканировать некоторые страницы. Я получаю start_urls из листа Excel, и мне нужно сохранить URL-адрес в элементе. class abc_Spider(BaseSpider): name = 'abc' allowed_domains = ['abc.com'] wb = xlrd.open_workbook(path + ...

4 ответа

Передайте Scrapy Spider список URL для сканирования через .txt файл

Я немного новичок в Python и очень плохо знаком с Scrapy. Я настроил паука для сканирования и извлечения всей необходимой мне информации. Однако мне нужно передать .txt файл URL-адресов в переменную start_urls. Например: class ...

1 ответ

Android Web Scraping с помощью браузера без головы

Я потратил день на исследование библиотеки, которая может быть использована для достижения следующих целей: Получить все содержимое веб-страницы, как в фоновом режиме, не отображая результат в представлении.Библиотека должна поддерживать ...

1 ответ

PYTHON SCRAPY не может отправить информацию в формы,

Я думаю, что я попрошу очень большую услугу, поскольку я боролся с этой проблемой несколько дней. Я перепробовал все возможные (насколько мне известно) способы и до сих пор не дал результата. Я делаю что-то не так, но все еще не могу понять, что ...

1 ответ

Получение PY_VAR1 при печати «запроса»

Я делаю простой веб-код, и когда я пытаюсь напечатать значение, это дает мне что-то еще. def PeopleSearch(): query = SearchTerm query = ('what is '+ query) print str(query) SearchTerm = StringVar(None) SearchText = ...