JSoup.connect löst den Fehler 403 aus, während apache.httpclient den Inhalt abrufen kann
Ich versuche, HTML-Dump einer bestimmten Seite zu analysieren. ich benutzteHTML-Parser und auch ausprobiertJSoup zum Parsen.
Ich habe nützliche Funktionen in Jsoup gefunden, aber beim Aufruf wird der Fehler 403 angezeigtDocument doc = Jsoup.connect(url).get();
Ich habe HTTPClient ausprobiert, um den HTML-Speicherauszug zu erhalten, und er war für dieselbe URL erfolgreich.
Warum gibt JSoup 403 für dieselbe URL an, die den Inhalt von Commons-http-Client enthält? Mache ich etwas falsch? Irgendwelche Gedanken?