Apache Nutch 2.1 verschiedene Batch ID (null)
Ich crawle nur wenige Websites mit Apache Nutch 2.1.
Beim Crawlen wird auf vielen Seiten die folgende Meldung angezeigt:
Ex. Überspringenhttp://www.domainname.com/news/subcategory/111111/index.html; unterschiedliche Batch-ID (null).
Wodurch wird dieser Fehler verursacht?
Wie kann ich dieses Problem beheben, da die Seiten mit unterschiedlicher Batch-ID (null) nicht in der Datenbank gespeichert werden?
Die Seite, die ich gecrawlt habe, basiert auf Drupal, aber ich habe es auf vielen anderen Nicht-Drupal-Seiten versucht.