Suchergebnisse für Anfrage "scrapy"

8 die antwort

Scrapy - wie man bereits abgekratzte URLs identifiziert

Ich verwende scrapy, um täglich eine Nachrichten-Website zu crawlen. Wie kann ich verhindern, dass Scrapy bereits gescrappte URLs verschrottet? Gibt es auch eine klare Dokumentation oder Beispiele aufSgmlLinkExtractor.

2 die antwort

Wie machst du ein Selenskript schneller?

Ich verwende Python Selenium und Scrapy zum Crawlen einer Website. Aber mein Skript ist so langsam, Crawled 1 pages (at 1 pages/min) Ich benutze CSS SELECTOR anstelle von XPATH, um die Zeit zu optimieren. ich ändere die ...

2 die antwort

Scrapy Datei hochladen

Ich stelle eine Formularanforderung an eine Website mithilfe von Scrapy. Für das Formular muss eine PDF-Datei hochgeladen werden. Wie können wir das in Scrapy tun? Ich versuche das wie ...

TOP-Veröffentlichungen

2 die antwort

Warum gibt Scrapy einen Iframe zurück?

ch möchte crawlDiese Seit [http://www.ooshop.com/courses-en-ligne/Home.aspx] von Python-Scrapy ich versuche das class Parik(scrapy.Spider): name = "ooshop" allowed_domains = ["http://www.ooshop.com/courses-en-ligne/Home.aspx"] def ...

8 die antwort

pyconfig.h fehlt während der “Kryptografie der Pip-Installation”

Ich möchte einen Scrapy-Cluster einrichten. Folgen Sie diesem Link. scrapy-cluster [http://scrapy-cluster.readthedocs.io/en/latest/topics/introduction/quickstart.html#cluster-quickstart] , Alles ist in Ordnung, bevor ich diesen Befehl ...

2 die antwort

Scrapy kann nicht dazu gebracht werden, 301, 302 Weiterleitungen zu analysieren und zu befolgen

Ich versuche, einen sehr einfachen Website-Crawler zu schreiben, der URLs mit Verweis- und Statuscodes für 200, 301, 302 und 404 http-Statuscodes auflistet. Es stellt sich heraus, dass Scrapy großartig funktioniert und mein Skript es richtig ...

4 die antwort

Wie funktioniert Scrapy-Splash mit unendlichem Scrollen?

Ich möchte den Inhalt zurückentwickeln, der durch Scrollen in der Webseite erzeugt wird. Das Problem liegt in der URLhttps://www.crowdfunder.com/user/following_page/80159?user_id=80159&limit=0&per_page=20&screwrand=933. screwrand scheint keinem ...

2 die antwort

Wie schreibe ich angepasste Downloader-Middleware für Selen und Scrapy?

Ich habe ein Problem mit der Kommunikation zwischen Selen und Scrapy-Objekt. Ich benutze Selen, um mich bei einer Site anzumelden. Sobald ich diese Antwort erhalte, möchte ich die Funktionäre von scrape zum Parsen und Verarbeiten verwenden. ...