Nutch Raw Html Saving
Ich versuche, rohes HTML von gecrawlten Seiten in verschiedenen Dateien zu erhalten, die als URL der Seite bezeichnet werden. Ist es möglich mitNutch Speichern Sie die rohen HTML-Seiten in verschiedenen Dateien, indem Sie den Indexierungsteil ausschließen?