JSoup.connect löst den Fehler 403 aus, während apache.httpclient den Inhalt abrufen kann

Question

Apr 12, 2012, 11:24 AM

Ich versuche, HTML-Dump einer bestimmten Seite zu analysieren. ich benutzteHTML-Parser und auch ausprobiertJSoup zum Parsen.

Ich habe nützliche Funktionen in Jsoup gefunden, aber beim Aufruf wird der Fehler 403 angezeigtDocument doc = Jsoup.connect(url).get();

Ich habe HTTPClient ausprobiert, um den HTML-Speicherauszug zu erhalten, und er war für dieselbe URL erfolgreich.

Warum gibt JSoup 403 für dieselbe URL an, die den Inhalt von Commons-http-Client enthält? Mache ich etwas falsch? Irgendwelche Gedanken?

Antworten auf die Frage(1)

JavaScript in AMP ausführen

Wie vergleiche ich zwei Strings in der Bash-Version?

Python 3.5 + PyQt5 zu Standalone-Exe

Angular 2 Event Emitter vs Subject

Fehler bei Verwendung der Google Maps-API "Nicht erfasster Referenzfehler: Google ist nicht definiert".