Результаты поиска по запросу "web-crawler"

1 ответ

Найти текст внутри тега JavaScript с помощью PHP Simple HTML DOM Parser

Я пытаюсь найти текст изменения регулярно внутри тега JavaScript: <script type="text/javascript"> jwplayer("mediaplayer").setup({ flashplayer: "player.swf", file:"filename", provider: ...

1 ответ

Найти текст внутри тега JavaScript с помощью PHP Simple HTML DOM Parser

Я пытаюсь найти текст изменения регулярно внутри тега JavaScript:

3 ответа

Scrapy Python Настроить пользовательский агент

Я попытался переопределить user-agent моего crawlspider, добавив в проект дополнительную строкуконфигурационный файл [http://doc.scrapy.org/en/latest/topics/settings.html#project-settings-module], Вот код: [settings] default = myproject.settings ...

ТОП публикаций

3 ответа

Scrapy Python Настроить пользовательский агент

Я попытался переопределить user-agent моего crawlspider, добавив в проект дополнительную строкуконфигурационный файл, Вот код:

1 ответ

Веб-сайты, которые особенно трудно сканировать и сканировать? [закрыто]

Я заинтересован в общедоступных сайтах (ничего за логином / аутентификацией), которые имеют такие вещи: Высокое использование внутренних 301 и 302 редиректовПротивоскребающие меры (но не запрещающие сканеры через robots.txt)Несемантическая или ...

1 ответ

Веб-сайты, которые особенно трудно сканировать и сканировать? [закрыто]

Мне интересны общедоступные сайты (ничего за логином / аутентификацией), которые имеют такие вещи как:Высокое использование внутренних 301 и 302 редиректовПр...

2 ответа

Является ли строка User-Agent в robots.txt точным совпадением или совпадением подстроки?

Когда сканер читает строку User-Agent файла robots.txt, он пытается точно сопоставить ее со своим собственным User-Agent или пытается сопоставить ее как подстроку своего User-Agent? Все, что я прочитал, явно не отвечает на этот вопрос. Согласно ...

2 ответа

Является ли строка User-Agent в robots.txt точным совпадением или совпадением подстроки?

Когда сканер читает строку User-Agent файла robots.txt, он пытается точно сопоставить ее со своим собственным User-Agent или пытается сопоставить ее как подс...

2 ответа

ошибка сканирования [имя паука]

Привет, ребята, я строю веб-проект с использованием Scrapy Framework и Python. В папке паука моего проекта у меня есть два паука с именами spider1 и spider2 spider1.py class spider(BaseSpider): name= "spider1" ........ ........spider2.py class ...

2 ответа

ошибка сканирования [имя паука]

Привет, ребята, я строю веб-проект с использованием Scrapy Framework и Python. В папке паука моего проекта у меня есть два паука с именами spider1 и spider2s...