Suchergebnisse für Anfrage "scrapy"

2 die antwort

Mehrfache Vererbung in Kratzspinnen

Ist es möglich, einen Spider zu erstellen, der die Funktionalität von zwei Basisspidern übernimmt, nämlich SitemapSpider und CrawlSpider? Ich habe versucht, Daten von verschiedenen Websites zu entfernen, und festgestellt, dass nicht alle ...

4 die antwort

Konvertieren Sie den XPath, der vom Browser auf XPath für Scrapy verwendet wurde.

Dies ist ein Problem, dass ich mit meinem Browser immer einen bestimmten XPath habe. Angenommen, ich möchte alle Bilder von einigen Websites wie Google Image Search oder Pinterest extrahieren. Wenn ich @ benutInspect element dann ...

2 die antwort

Python konvertieren chinesische Schriftzeichen in URL

Ich habe eine URL wie href = "../ job / jobarea.asp? C_jobtype = 經營 經營 主管 & peoplenumber = 151", dies wird im inspect-Element angezeigt. Wird es jedoch in einem neuen Tab geöffnet, wird es als @ angezeig .. / job / jobarea.asp? C_jobtype =% ...

TOP-Veröffentlichungen

4 die antwort

Verwenden des Anmeldeformulars mit scrapy

Das Scrapy-Framework https: //github.com/scrapy/scrap [https://github.com/scrapy/scrapy]) bietet eine Bibliothek für die Anmeldung bei Websites, für die eine Authentifizierung erforderlich ist.https: //github.com/scrapy/loginfor ...

4 die antwort

Schreiben eines Programms zum Scrappen von Foren

Ich muss ein Programm schreiben, um Foren zu durchsuchen. Soll ich das Programm in Python mit dem Scrapy-Framework schreiben oder Php cURL verwenden? Gibt es auch ein PHP-Äquivalent zu Scrapy? Vielen Dan

4 die antwort

Scrapy-Pipeline zum Exportieren der CSV-Datei im richtigen Format

Ich habe die Verbesserung gemäß dem Vorschlag von alexce unten vorgenommen. Was ich brauche, ist wie das Bild unten. Jede Zeile sollte jedoch eine Bewertung enthalten: mit Datum, Bewertung, Bewertungstext und Link. Ich muss den Artikelbearbeiter ...

2 die antwort

Wie vermeide ich einen twisted.internet.error.ConnectionLost-Fehler bei der Verwendung von Scrapy?

Ich schabe ein paar Seiten mitscrapy [http://scrapy.org/] und erhalte den folgenden Fehler: twisted.internet.error.ConnectionLost Meine Befehlszeilenausgabe: 2015-05-04 18:40:32+0800 [cnproxy] INFO: Spider opened 2015-05-04 ...

2 die antwort

Wie wird Selen zusammen mit Scrapy verwendet, um den Prozess zu automatisieren?

Ich habe irgendwann erfahren, dass Sie Webtoolkits wie Selen verwenden müssen, um das Scraping zu automatisieren. Wie kann ich im Google Play Store auf die nächste Schaltfläche klicken, um die Bewertungen nur für meine College-Zwecke zu kratzen ...

6 die antwort

'NoneType' Objekt hat kein Attribut '_app_data' in scrapy \ twisted \ openssl

Während des Scraping-Vorgangs mit Scrapy wird von Zeit zu Zeit ein Fehler in meinen Protokollen angezeigt. Es scheint nirgendwo in meinem Code zu sein und sieht aus wie etwas in verdrehtem \ openssl. Irgendwelche Ideen, was das verursacht hat und ...

6 die antwort

Scraping dynamischer Inhalte mit Python-Scrapy

Disclaimer: Ich habe zahlreiche andere ähnliche Posts auf StackOverflow gesehen und versucht, es auf die gleiche Weise zu tun, aber anscheinend funktionieren sie auf dieser Website nicht. Ich verwende Python-Scrapy, um Daten von koovs.com zu ...