Apache Nutch 2.1 inny identyfikator partii (null)
Czołgam się kilka stron z Apache Nutch 2.1.
Podczas indeksowania na wielu stronach widzę następujący komunikat:
dawny. Skaczącyhttp://www.domainname.com/news/subcategory/111111/index.html; inny identyfikator partii (null).
Co powoduje ten błąd?
Jak mogę rozwiązać ten problem, ponieważ strony o innym identyfikatorze partii (null) nie są przechowywane w bazie danych.
Witryna, którą przeszedłem, jest oparta na drupal, ale próbowałem na wielu innych stronach innych niż drupal.